Column & interview

コラム

AI文字起こしサービス「easy writer」の音声認識精度を上げるためには

※音声データの質によって、認識率は飛躍的に向上します。下記の内容を参考にしてご使用ください。

<Q1>すでにICレコーダーなどで録音した音声データを文字起こしたいのですが、あまり精度がよくありません。どうすれば認識精度が上がりますか?

人間の耳では問題ないと思われる音声でも、PC(AI)に認識させるには難しいケースがほとんどです。話者が多かったり、雑音の多い状態で録音したデータの場合、うまく認識されない可能性があります。可能なら新たに録りなおしたデータをお使いなるようおすすめします。

<Q2>具体的にはどのような音声データを録ればいいのでしょうか?

・音声のサンプリングレートは、16kHz、もしくは、それ以上にしてください。
・ビット深度は、16bit。
・MP3などの圧縮形式は避けてください。録音時は基本的に非圧縮のWAV(リニアPCM、16bit)の選択がベストです。
※「easy writer」に直接入した音声データは自動的にWAVとなります。
・話者ひとりの場合は、モノラル録音で問題ありません。複数の話者の識別を行う場合などにおいては、各人専用のマイクを用意するか、ステレオ録音にします。

<Q3>録音の際に気を付けるべきことは何でしょうか?

会議やインタビューの状況にもよりますが、話者の方々に「easy writer」を使うことを事前にお知らせし、以下のように協力していただくようにしましょう。
•PCの画面を見せて「easy writer」を使っていることを話者に理解していただく
•はっきり、大きな声で、ゆっくり話していただくよう事前のコミュニケーションをとる
•雑音ができるだけ少ない場所で使用する
ことが必要です。
※はじめのうちは理解を得るのが難しいと思いますが、認識率が明らかに向上します。

<Q4>複数の話者がいる会議ではどのように音声を録ったらいいでしょうか?

・必ずICレコーダーを使って録音してください。録音の際の注意事項はQ1をご覧ください。
・話者ひとりにつき、マイク1台を用意し、ミキサーを使用してください。「easy writer」を使う際にはミキサーの音声データをPCに取り込んで文字起こしをします。
・マイクを使わずICレコーダーだけで録音する際は、ICレコーダーのモードを「会議」などに設定してください。

<Q5>PCのみで直接入力する場合はどうしたらいいでしょうか?

・PCの画面(マイク)を話者に向けて話していただきます
・念のため、ICレコーダーでも録音しておくことをおすすめします。
・直接入力の場合は複数話者での使用はおすすめできません。ICレコーダーをお使いください。

<Q6>ICレコーダーを使用する場合の注意事項を教えてください

・録音前にQ1の設定になっているかどうか確認します。
・録音モード設定がある場合、「インタビュー」「会議」など状況に合わせた設定にします。
・ICレコーダーをハンカチやソフトケースの上に置くとテーブルの振動音など雑音を防ぎます。
・会議などでコの字型に座る場合は、短辺のテーブルにICレコーダーを置きます。
・ICレコーダーも「easy writer」も、本番に近い環境で事前に試用することをお勧めします
・その他、レコーダーのマニュアルに従ってください。

<Q7>PCはどのようなものを使えばいいでしょうか?

・同じ音声データであっても「インテル 第10世代 CORE i7」などCPUの性能が高ければ認識精度も高くなります。明らかに認識率が違いますので、会社内などで最も高スペックなPCを使われるようお勧めします。


※その他のお問合せは[email protected]
対面やお電話(℡03-6272-353)でのサポートも承ります。お気軽にご連絡ください。

記事一覧