それ、面白いアイテムですね!

パソコンやIT、ガジェットなどについて綴るよ!

それおも

音読さんのナレーターによる同音異義語を「トランスクリプト」がどう認識するのか大実験!

同音異義語はAIにどう認識されるの?

今回は前回の記事の続きとなります。

soreomo.com



前回の記事でMicrosoft365の機能であるトランスクリプトを利用して、土岐麻子さんとバカリズムさんのセリフを文字起こししてみました。

そこで、「同じ発音で違う意味の言葉はどんな感じ?」というコメントをいただきましたので、早速大実験!

コメントありがとうございます✨ とっても嬉しい♪

いまのところさんにんきものよ

ネットで同音異義語を調べていたところ、素晴らしい文章(いまのところさんにんきものよ)があったので、音読さんにナレーションをしていただき、トランスクリプトがどう文字起こしをするか試してみました。

ondoku3.com

「いまのところ、さんにんきものです」を文字起こし

トランスクリプトが有利になるように少し手を加えます。

AIがぶれないように語尾に修正を加えて、さらに読点もつけて音読さんにナレーションをしてもらいました。

「いまのところさんにんきものよ」→「いまのところ、さんにんきものです」

音読さんの設定は下記のとおりです。

読点を打って認識しやすいようにした
読点を打って認識しやすいようにした

対象文章:「いまのところ、さんにんきものです」
ナレーション: 音読さん


さぁ、ドキドキの結果は!?

結果は「今のトコロさん人気者です。」となりました。
結果は「今のトコロさん人気者です」となりました。


「ところ、さん」と読点を付けましたが、AIは「トコロさん」と認識した模様です。

読点があるので、「3人着物です」と認識するかと思いましたが、予想が外れました。

トコロさんは人気者だから仕方が無いね

「いまのところさんにんきものです」を文字起こし

では次に余計なお節介の読点は付けずに「いまのところさんにんきものです」とナレーションしてもらったらどうなるかを実験してみました♪

対象文章:「いまのところさんにんきものです」
ナレーション: 音読さん



音読さんの設定は下記のとおりです。

「いまのところ、さんにんきものです」と読点を消す
「いまのところさんにんきものです」と読点を消す


さぁ、ドキドキの結果は!?

結果は「今のトコロさん人気者です。」となりました。
結果は「今のトコロさん人気者です」となりました。

やっぱりトコロさんは人気者♪

Twitterのリプでいただいた言葉もやってみる

今回うぇいくはTwitterで「同音異義語を使った文章を教えて欲しいな」とお願いしたところ、このようなリプをいただきました。



  1. 「おしりあいですか」

  2. 「おみせあくのじゅうじか」

  3. 「きょうふのみそしる」

  4. 「くつはかせたろう」


ナレーション: 音読さん

まとめて音読さんにナレーションをしてもらった
まとめて音読さんにナレーションをしてもらった

早速トランスクリプトしてみるよ

結果はこの通り!
結果はこの通り!



「おしりあいですか」
👉きちんと文字起こしされましたね。クレヨンしんちゃんと「お尻合い~」にはなりませんでした。

「おみせあくのじゅうじか」
👉「お店役の」となっており「あ」を「や」と認識していますね。AIが〇〇役という言葉を覚えているからなのかも知れません。

「きょうふのみそしる」
👉恐怖の味噌汁! AIも怖がってるよ、絶対!

「くつはかせたろう」
👉「靴をはかせたろう」というニュアンスなんでしょうね。

ちなみに「はかせたろうをしっていますか」という文章でやってみたら、「葉加瀬太郎を知っていますか? 」となりました。
AIは葉加瀬太郎を認識した上で、文脈を読み取って、ひらがなにしたのでしょう。

たくすさん、にしたつさんの名前は漢字になってしまいますね。

たくすさん、にしたつさん、ありがとうございました♪

「なにそれこわい」を文字起こし

ネットで見つけたこんな会話があったので、
これも同じように実験をしてみました☆

店員「当店のポイントカードはお餅でしょうか」
ぼく「えっ」
店員「当店のポイントカードはお餅ですか」
ぼく「いえしりません」
店員「えっ」
ぼく「えっ」
店員「まだお餅になってないということでしょうか」
ぼく「えっ」
店員「えっ」
ぼく「変化するってことですか」
店員「なにがですか」
ぼく「カードが」
店員「ああ使い続けていただければランクがあがってカードが変わりますよ」
ぼく「そうなんだすごい」
店員「ではお作りいたしましょうか無料ですよ」
ぼく「くさったりしませんか」
店員「えっ」
ぼく「えっ」
店員「ああ期限のことなら最後に使ってから一年間使わないときれます」
ぼく「なにそれこわい」
店員「ちょくちょく来ていただければ無期限と同じですよ」
ぼく「なにそれもこわい」
店員「えっ」
ぼく「えっ」


なにそれこわい (かんちがいからくるきょうふ)とは【ピクシブ百科事典】

読み上げた音声はこちらで聴くことができます。

ナレーション: 音読さん

音声を聞いて貰うと分かりますが、うまく認識しないと思い、途中の「えっ」は飛ばしています。


トランスクリプトで文字起こしした結果がこれです。


短い「えっ」というのはうまく処理できないようですが、おおよそ思ったとおりに文字起こしされたのかな、と思います。

ほんとは、「お餅」と変換するかも!って少し期待したよ

おわりに

今回はコメントやTwitterのリプからブログネタとして綴った記事となりました。

AIが同音異義語をどう認識するかをやってみましたが、
それなりにきちんと文脈も捉えて文字起こしをしているような雰囲気がありました。

これからは音声もテキストに起こすことが簡単になりますね。

翻訳もかなりの精度となっているので、外国語の音声を一瞬で日本語音声+テキストにできるでしょう。

YouTubeの翻訳もリアルタイムでできるので、海外の動画も見やすくなりました。

それでは、今回のそれおも度は⋯

肉球スタンプ4つ!
肉球スタンプ4つ!


Amazonならお得な「Microsoft365 ダウンロード版」が購入できるよ!

Amazon公式より