音声読み上げ「Amazon Polly」で文章の校正

ブログ記事をchatGPTのWeb-APIを使った自作ソフト「chatGPT編集長」に校正してもらっていますが、意外と「てにをは」のチェックが甘く、読み直すと表現がおかしい箇所があります。

最後は自分で原稿を読み直してチェックするのですが、新たな校正ツールとして、テキストの音声読み上げを使用することにしました。

人間の脳は普段から耳で会話を聞き、内容を判断しているため、契約書などは、自分で文章を読み込むよりも、読み上げてもらうほうが効率的に違和感のある箇所や間違いを探せると言われています。

業務では「音読さん」を使用して、主に動画のナレーション作成に使用しています。無料版では1月5000文字で、私のブログの1記事が平均1200文字程度なので、無料版枠を超えてしまいます。

ネットで調べた結果、AWS(Amazon Web Service)の中に深層学習を使ったテキスト読み上げサービス「Amazon Polly」が1年間は500万文字/月無料です。1年過ぎると100万文字/月で4ドルなので、お試しで使ってみることにしました。おそらく、家で使っているスマートスピーカーAlexaも同じ技術を使っていると思います。

AWSは個人での使用のため、ブログ用のAWSアカウントを作成して、「Amazon Polly」を早速試してみました。使い方はWeb上にテキストエリアに読み上げるテキストをコピーをして「読み上げ」ボタンを押すだけです。「音読さん」よりもイントネーションが劣る気もしますが、目的は文章のチェックなので十分使えます。

Amazonはネットショッピングの会社のイメージがありますが、自社でショッピングサイトを運用するために使用していたサーバーを利用して新たなビジネスモデルを構築しました。それがクラウドコンピュータのサービスAWS(Amazon Web Services)です。AWSはクラウドの基本となるプラットフォームで、「メルカリ」などのSaaS(Software as a Service)の下支えになっている技術です。現在、クラウドのシェアはトップですが、MicrosoftのクラウドAzureに猛追をされています。原因は生成AIに特化したクラウドコンピューターをMicrosoftが提供しているからです。chatGPTもMicrosoft Azure上で動作しています。

生成AIによって、クラウドコンピューターではAmazon対Microsoftの戦いが激化しています。Amazonはどんな対抗策を出してくるのか。今後の展開が注目されます。

コメント

このブログの人気の投稿

マイナカードに物申す#2 どうする富士通 

Before After Rock Musician 歳を取ることはカッコイイ

日本縮小#4 「22世紀の民主主義 選挙はアルゴリズムになり、政治家はネコになる 」

楽天モバイルとラマンチャの男「三木谷社長」

マイクトソフト VS グーグル Webの覇権争い

中野サンプラザ閉館 どうするサンプラザ中野くん

「うたかたの日々」 岡崎京子を再評価する

UA終了問題とGA4移行のコツ Webの裏側の話

AI・人工知能EXPOレポート  進化するAIの民主化

バルカンファイル(Vulkan Files)流出 犯罪国家ロシア#2