音声入力で自分の声を分析できるのか試してみた

YouTubeで物まね芸人さんの動画を見ていた時に、ふと思い出したことがありました。

そういえば、ChatGPTを使う時に音声入力を使っていたなと。

「音声入力しているなら、自分の声がどんな有名人や声優さんに似ているか分析できるのでは？」

そう思い、ChatGPTに聞いてみました。

ChatGPTの音声入力で使っているマイクボタンは、あくまで文字入力用で、声質そのものを分析する機能ではないとのこと。ただ、音声ファイルをアップロードすれば、ある程度の分析はできるみたいです。

実際に試してみたところ、誰かに似ているという回答はありませんでしたが、「低音寄り」「落ち着いた声」という分析はしてもらえました。

短い音声よりも日常会話のような長めの音声の方が細かく分析できるらしく、今度また試してみようと思っています。

最近、音声入力を試していて感じたこと。うまく認識されない時は、滑舌よりも「入力する環境」が大事でした。

特に効果があったのはこの3つです。音声入力ボタンをONにして1〜3秒待つ、マイクを口元に近づける、小さすぎる声で話さない。これだけでも認識精度がかなり変わりました。

最初は机にマイクを置いたまま話していましたが、距離が遠いとノイズや反響を拾いやすいらしく。さらに寝起きのガラガラ声だと、日本語ではなく別の言語として認識されることも。

「少し待ってから、口元で話す」

これを意識するだけでかなり安定しました。音声入力は、最初の一言が思った以上に大事なのかもしれない。

あと、YouTubeなどの動画を開きながら音声入力すると影響を受けることもあるみたいなので、自分の声や環境に合った方法を探してみるのが良さそうです。