同音異義語はAIにどう認識されるの?
今回は前回の記事の続きとなります。
前回の記事でMicrosoft365の機能であるトランスクリプトを利用して、土岐麻子さんとバカリズムさんのセリフを文字起こししてみました。
そこで、「同じ発音で違う意味の言葉はどんな感じ?」というコメントをいただきましたので、早速大実験!
コメントありがとうございます✨ とっても嬉しい♪
いまのところさんにんきものよ
ネットで同音異義語を調べていたところ、素晴らしい文章(いまのところさんにんきものよ)があったので、音読さんにナレーションをしていただき、トランスクリプトがどう文字起こしをするか試してみました。
「いまのところ、さんにんきものです」を文字起こし
トランスクリプトが有利になるように少し手を加えます。
AIがぶれないように語尾に修正を加えて、さらに読点もつけて音読さんにナレーションをしてもらいました。
「いまのところさんにんきものよ」→「いまのところ、さんにんきものです」
音読さんの設定は下記のとおりです。
ナレーション: 音読さん
さぁ、ドキドキの結果は!?
「ところ、さん」と読点を付けましたが、AIは「トコロさん」と認識した模様です。
読点があるので、「3人着物です」と認識するかと思いましたが、予想が外れました。
トコロさんは人気者だから仕方が無いね
「いまのところさんにんきものです」を文字起こし
では次に余計なお節介の読点は付けずに「いまのところさんにんきものです」とナレーションしてもらったらどうなるかを実験してみました♪
ナレーション: 音読さん
音読さんの設定は下記のとおりです。
さぁ、ドキドキの結果は!?
やっぱりトコロさんは人気者♪
Twitterのリプでいただいた言葉もやってみる
今回うぇいくはTwitterで「同音異義語を使った文章を教えて欲しいな」とお願いしたところ、このようなリプをいただきました。
お知り合いですか😊?→お尻愛ですか😱?
— たくす@アフィリエイトブロガー (@taksBLOG) 2022年6月15日
有名なのでもいいですか?😅
— にしたつ@ブログ勉強中 (@eco_nishitatsu) 2022年6月16日
お店悪の十字架 → お店開くの10時か?
恐怖の味噌汁 → 今日麩の味噌汁
靴葉加瀬太郎 → 靴履かせたろう
「おしりあいですか」
「おみせあくのじゅうじか」
「きょうふのみそしる」
「くつはかせたろう」
ナレーション: 音読さん
早速トランスクリプトしてみるよ
「おしりあいですか」
👉きちんと文字起こしされましたね。クレヨンしんちゃんと「お尻合い~」にはなりませんでした。
「おみせあくのじゅうじか」
👉「お店役の」となっており「あ」を「や」と認識していますね。AIが〇〇役という言葉を覚えているからなのかも知れません。
「きょうふのみそしる」
👉恐怖の味噌汁! AIも怖がってるよ、絶対!
「くつはかせたろう」
👉「靴をはかせたろう」というニュアンスなんでしょうね。
ちなみに「はかせたろうをしっていますか」という文章でやってみたら、「葉加瀬太郎を知っていますか? 」となりました。
AIは葉加瀬太郎を認識した上で、文脈を読み取って、ひらがなにしたのでしょう。
たくすさん、にしたつさんの名前は漢字になってしまいますね。
たくすさん、にしたつさん、ありがとうございました♪
「なにそれこわい」を文字起こし
ネットで見つけたこんな会話があったので、
これも同じように実験をしてみました☆
店員「当店のポイントカードはお餅でしょうか」
ぼく「えっ」
店員「当店のポイントカードはお餅ですか」
ぼく「いえしりません」
店員「えっ」
ぼく「えっ」
店員「まだお餅になってないということでしょうか」
ぼく「えっ」
店員「えっ」
ぼく「変化するってことですか」
店員「なにがですか」
ぼく「カードが」
店員「ああ使い続けていただければランクがあがってカードが変わりますよ」
ぼく「そうなんだすごい」
店員「ではお作りいたしましょうか無料ですよ」
ぼく「くさったりしませんか」
店員「えっ」
ぼく「えっ」
店員「ああ期限のことなら最後に使ってから一年間使わないときれます」
ぼく「なにそれこわい」
店員「ちょくちょく来ていただければ無期限と同じですよ」
ぼく「なにそれもこわい」
店員「えっ」
ぼく「えっ」
なにそれこわい (かんちがいからくるきょうふ)とは【ピクシブ百科事典】
読み上げた音声はこちらで聴くことができます。
ナレーション: 音読さん
音声を聞いて貰うと分かりますが、うまく認識しないと思い、途中の「えっ」は飛ばしています。
トランスクリプトで文字起こしした結果がこれです。
短い「えっ」というのはうまく処理できないようですが、おおよそ思ったとおりに文字起こしされたのかな、と思います。
ほんとは、「お餅」と変換するかも!って少し期待したよ
おわりに
今回はコメントやTwitterのリプからブログネタとして綴った記事となりました。
AIが同音異義語をどう認識するかをやってみましたが、
それなりにきちんと文脈も捉えて文字起こしをしているような雰囲気がありました。
これからは音声もテキストに起こすことが簡単になりますね。
翻訳もかなりの精度となっているので、外国語の音声を一瞬で日本語音声+テキストにできるでしょう。
YouTubeの翻訳もリアルタイムでできるので、海外の動画も見やすくなりました。
それでは、今回のそれおも度は⋯
Amazonならお得な「Microsoft365 ダウンロード版」が購入できるよ!
Amazon公式より