音源を自動で文章化するAIレコーダー、ソースネクストの新製品を記者も体験イノベーションのレシピ(2/2 ページ)

» 2020年11月13日 14時00分 公開
[池谷翼MONOist]
前のページへ 1|2       

「使いやすさ」にこだわったデバイスデザイン

 工夫点はハードウェアとソフトウェアの両方にある。ハードウェアの面では操作感がシンプルになるようにデバイス設計を行ったという。デバイス正面に配置された大きなボタンを押せばすぐに録音が開始されるので、細かな操作に迷うことがない。録音ボタン下部には「ブックマークボタン」も配置されている。会議中、重要なテーマが提議された時や、議題が切り替わった時などのタイミングで押すと、文字起こし後のテキストデータにブックマークが反映される。これによって重要な箇所を後から見返しやすくなる。

 ソフトウェア面では、アプリ上で全ての録音データを対象としたキーワード検索が行えるようにした。重要性の高い単語などを手掛かりに、目当ての録音データをすぐに探せる。

 デバイスの本体価格は税込みで1万9800円。録音データのボリュームに応じた3つの料金プランが用意されており、毎月1時間までテキスト化が可能なベーシックプラン(無料)、30時間まで可能なプレミアムプラン(月額980円)、1回のチャージで10時間まで対応する10時間チャージ(1回980円)がある。価格はいずれも税込み。なお、松田氏はオートメモの販売目標について、2021年末までに10万台という数値を掲げる。

ソースネクストが作成した議事録作成サービスとのコスト比較表*出典:ソースネクスト[クリックして拡大]

オートメモのテキスト化精度をレビュー

 都内で開催した記者会見では、オートメモのサンプル品が配布された。後日発売となる製品版と比較すると、機能面に細かな相違はあるものの、デザインや基本機能などはほぼ共通している。せっかくの機会なので、AIによるテキスト化の精度をレビューしようと思う。

十分実用に耐え得るテキスト化の精度と速度

 精度を検証するための音声素材として、今回は本稿の冒頭を記者自身が読み上げたデータを録音して使うことにする。元の文章は前ページで確認していただきたい。録音時間は1分9秒。テキストデータは録音後、すぐに送信されてきた。結果は以下の通りである。

ソースネクストは2020年11月10日 AI 人工知能通訳機ポケトークの音声認識エンジンを活用した自動文字起こしボイスレコーダーオートメモの予約受付を開始すると発表した。製品発売日は同年12月4日。

AI が自動で音源をテキスト化するため、文字起こしな手間を省力化できる。 まだ難聴者向けの AI VOICE 筆談器タブレット見にも合わせて発売する

(ブックマーク)

ポケトークのテクノロジーを翻訳分野以外にも天海

ソースネクスト代表取締役社長松田憲之氏は同社の製品開発方針について当社は世界中の技術はあらゆる人に届けるというビジョンを掲げて企業活動を行っているその一環として現在ポケトークに使われているテクノロジーを翻訳用途だけでなく音声からのテキスト化など本来とは異なる分野にも積極的に展開しようと様々な製品を開発していると説明する

 個人的には、固有名詞の認識ミスや幾つかの誤記(「展開」が「天海」に)を除くと、大意は取りやすく、実用に耐え得る水準で文字起こしが実現できているのではないかと考える。ただ、実際の使用時には音源を聞きながらテキストデータに修正を加えていく必要があるだろう。オートメモはクラウド上でテキストデータと録音データをひも付けており、アプリで表示したテキストデータ上から特定箇所を選択すると、その部分だけを再生できる。音源の頭出しなどの手間が省けるので、効率的に作業がしやすいように感じる。

アプリ上で表示された実際のテキストデータ*出典:ソースネクスト[クリックして拡大]

 一方で、テキストデータ上では発言者の識別がなされないため、やや不便さも感じる。発言の合間に若干の間を置くと、テキスト化時に自動で改行がなされるが、あまり間をおかずに発言すると、切れ目なくテキスト化されてしまう。会議など多人数が次々に発言する場合は、テキストデータだけでは発言者が判別しにくい。使い方を工夫するか、音源を聞きながらテキストを修正する作業工程が必要になるだろう。

ポケトークmimiの改良版も発売

 ソースネクストはオートメモと同時に、ポケトークmimiの改良版であるタブレットmimiも発売する。ポケトークmimiでは発言者がボタンを押しながら発話しなければテキスト化が行えなかったが、タブレットmimiはデバイスの近くで発話するだけでテキスト化が行えるようにした。音声データはWi-Fiなどを通じてクラウド上に送信され、AIが素早くテキスト化してタブレットに送信、表示する。卓上に置いて使用するタブレットタイプのため、ハンズフリーで使える利便性と、設置時の安定性、携帯性の高さなどが特徴だ。なお、端末にはeSIMが搭載されており、LTE通信にも対応する。充電は専用のクレードルで行う。

タブレットmimiの製品外観イメージ(デバイス本体は開発中)*出典:ソースネクスト[クリックして拡大]

 「新型コロナウイルス感染症(COVID-19)の感染拡大以降はマスク着用者が増えたため、難聴者が相手の口の動きから発話内容を推測することが難しくなってしまった。当社で独自のアンケートを実施したところ、難聴者の8割がマスク着用が日常化したことで会話が不便になったと回答している。この不便さは、難聴者が家族にいる介護者も同様に感じているようだ。音声だけで文字化が行えるタブレットmimiはこうしたニーズをくみ取れると考えている」(松田氏)

⇒その他の「イノベーションのレシピ」のニュースはこちら

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.