完全オフラインでリアルタイムに文字起こし、注目のAIライティングレコーダー「VOITER SR302 Pro」をレビュー

AIライティングレコーダー「VOITER SR302Pro」

ボイスレコーダーなどで録音した音声を文字起こしする際、今までは音声を聞きながら手作業で入力するしか方法がなかった。しかし、AIの進化にともない、最近では自動で文字起こしをしてくれるサービスが登場し、利用者も増えつつある。一方で、こうしたサービスの多くは有料であることに加え、クラウド上で文字起こしをするため、データ漏えいなどセキュリティ面での不安も抱えていた。こうした中、注目を集めているのがiFLYTEKのAIライティングレコーダー「VOITER SR302Pro」だ。同製品は、完全オフラインでリアルタイムに文字起こしができるという。そこで今回、実際に「VOITER SR302Pro」を使用して、オフライン文字起こしを体験してみた。

iFLYTEKの「VOITER SR302Pro」は、インターネットやWi-Fiなど外部通信が一切不要で、本体内の機能のみで音声録音と文字起こしができるAIライティングレコーダー。完全オフライン環境で文字起こし機能が使えるライティングレコーダーは、同製品が日本初とのこと(2022年7月時点(iFLYTEK調べ))。文字起こしの処理は、本体に内蔵しているAI音声認識エンジンで行い、文字起こしの性能および機能向上のアップデートは、別途PCからファイルをコピーして行うことができる。また、日本語、英語、中国語、韓国語、ロシア語の5言語に対応している。

録音モードを「自動モード」に設定

今回、記者説明会や試食会などの取材の際に、「VOITER SR302Pro」を使用して音声録音と文字起こしを行ってみた。まず、使用する前に録音モードを確認。「VOITER SR302Pro」には、「自動モード」「会議モード」「講演モード」「インタビューモード」の4モードが用意されており、利用シーンに合わせて選ぶことができる。今回はさまざまなシーンに適した「自動モード」に設定した。ちなみに、「会議モード」は複数人での会議、「講演モード」は5m以内の講演会や発表会、「インタビューモード」は1m以内で3人までのインタビューや対話シーンに適したモードとなっている。

文字起こしの内容をリアルタイムで画面表示

録音の際は、本体にある録音ボタンを押すだけで、すぐに録音が始まる。急な打ち合わせや聞き逃せない会話など、「いま録音したい」と思ったタイミングでも即座に対応可能だ。録音を開始すると同時に、文字起こしもスタート。本体画面には、文字起こしをしている内容がリアルタイムで表示される。録音中に画面をロックしたり、画面を切り替えても文字起こしが中断されることはない。もう一度録音ボタンを押すと、録音が終了し、記録データが自動保存される。また、本体画面はタッチパネルになっており、タッチ操作でも簡単に録音を開始、一時停止、終了することができる。

保存された音声および文字起こしデータをWindows PCに書き出す場合には、USBケーブルで「VOITER SR302Pro」とPCを接続し、本体画面の「ファイル書き出し」を選択すると、PCのエクスプローラーに「SR302 PRO」フォルダが表示される。次に、「内部共有ストレージ」-「RECORD_FILE」フォルダから、保存された音声データ(WAV形式)と文字起こしデータ(DOC形式)を確認し、必要なデータをドラッグ&ドロップでPCに書き出し・保存する。なお、Macにデータを書き出す場合には、「Android File Transfer」アプリをダウンロードする必要があるとのこと。

USBケーブルでPCと接続してデータ書き出し

音声の録音から文字起こし、データの書き出しまで、すべてオフラインで完結できるため、インターネットやWi-Fi接続がない環境でも利用でき、クラウドへのデータアップも不要。これによって、法曹界や医療業界、士業など守秘義務のある職業の人、またオンライン上に機密情報を保存することに懸念を持っている人でも、データ漏えいを心配することなく、セキュアに利用することが可能となっている。

実際に、「VOITER SR302Pro」の文字起こしデータを確認してみると、しっかり言葉を認識して文字起こしされていることがわかった。固有名詞や言い回しなどはうまく再現できていない部分もあるが、文字起こし全体を通して、録音した内容を把握するには十分の精度だと感じた。また、リアルタイム文字起こしだけでなく、保存した音声データの「再文字起こし」機能も備えており、録音時間の半分程度の時間で、より再現度の高い文字起こしを行うことができる。文字起こしの性能については、今後アップデートされていくため、さらなる精度向上にも期待される。

書き出した文字起こしデータは、DOC形式で編集が可能なので、正確性が求められる議事録や記事、レポートなどに使う際には、音声を聞きながら修正していくのがおすすめだ。今までのように、一から手打ちで文字起こしをするよりも大幅に作業時間を短縮できる。さらに、有料の文字起こしサービスを使う必要もなくなるため、コスト削減を図ることもできる。

6つのマイクを搭載した「VOITER SR302Pro」

もう一つ、注目すべき点は、録音した音声データがクリアで聞き取りやすいこと。「VOITER SR302Pro」には、360°集音に対応した無指向性マイクを4つ、発話距離最大5mに対応した指向性マイクを2つ、計6つのマイクを搭載。さらに、高度な雑音除去技術を採用し、不要なノイズを自動的に判断・除去する。この技術は、雑音環境での音声認識技術を競う国際コンテスト「CHiME」で2016~2020年(隔年開催)に3回連続世界No.1を受賞しているという。今回、試食会で使用した際には、周囲の雑音が多い環境だったが、録音データは雑音がなく音声をはっきり聞き取ることができた。

今まで、録音した音声データを聞きながら手打ちで文字起こしをしていた人、また音声データを有料のクラウドサービスを使って文字起こしをする機会が多い人は、業務の効率化や生産性向上のために、「VOITER SR302Pro」の活用を検討してみては。

[発売中]
[小売価格]3万9600円(税込)

VOITER SR302Pro製品ページ=https://www.iflytek.co.jp/sr302pro/
iFLYTEK公式オンラインショップ=https://store.iflytek.co.jp/


ヘッドライン

連載中コラム

健康管理!教えて!!
【連載】健康管理!教えて!!
マイライフストーリー ~新商品で日常を語る物語~
【連載】マイライフストーリー
健康管理!教えて!!
【連載】健康管理!教えて!!

マイライフストーリー ~新商品で日常を語る物語~
【連載】マイライフストーリー

 

カテゴリ