Amazon Transcribe を使って音声データからのテキスト変換

Voiced by Amazon Polly

前回の記事の続きです。Amazon Transcribe を使って音声データからのテキスト変換の精度を確認します。

目次

Amazon S3の設定

  • この処理専用のバケットを作成します。
  • バケット名を決めて、それ以外はすべてデフォルトで作成します。
  • 作成したバケットに音声データをアップロードします。
  • 2つの音声データをアップロードします。
  • 英語(Amazon Transcribeのチュートリアルのサンプルデータ)
  • 日本語(先日、利用させていただいた 島田市立図書館様の よむ・きく・ラヂオ の朗読データ)
  • 音声データのアップロードが完了しました。

Amazon Transcribe での音声データのテキストデータへの変換作業

  • Amazon Transcribe に移動して
  • Create job をクリックします。
  • Jobの名前と、言語の種類を English に設定します。
  • 先ほど、S3にアップロードした変換対象の音声データを指定します。
  • 音声データの指定が完了したら、Next をクリックします。
  • Option は何も設定せずに、Create job をクリックします。
  • 音声データからテキストデータへの変換作業が始まります。
  • 変換が完了しました。
  • テキストデータを確認します。
  • Amazon Transcribeのチュートリアル用のサンプルデータなので、精度は素晴らしいです。
  • 次に日本語音声データを試します。
  • 操作方法は、これまでと同様です。言語の種類を Japanese を設定するところが違うくらいです。
  • 変換結果を確認します。

Googleドキュメントを使った音声入力より、精度は高いようです。

よかったらシェアしてね!

この記事を書いた人

まん延防止等重点措置は解除されましたが、岡山県下の高等学校の部活動については、これまでと同様の措置での対応です。早く制限なく部活動が行えることを祈っています。今年こそは、久万高原でのラグビー合宿の応援に行きたいです。

目次
閉じる