デジタル人材の育成
公開日:2026年6月30日
本プロジェクトの目的は、AI時代における新しい音声入力手段を構築し、キーボードに依存しない入力体験を実現することである。生成AIの普及により、人間は文章作成、検索、要約、設計、コーディングなど、さまざまな作業をAIと協調して行うようになりつつある。一方で、AIが高速に出力を生成できるようになった現在、人間が自分の意図や修正内容を入力する速度が、AI活用の大きなボトルネックになっている。キーボード入力は依然として主要な入力手段であるが、思考の速度に追いつきにくい、タッチタイピングなど一定の習熟を要する、手を使えない状況や身体的制約がある場合に利用しづらいといった課題がある。
本プロジェクトでは、音声のみで意図の入力と内容の修正をリアルタイムに行えるシステムを開発する。核心は「話しながら直せる」点にある。ユーザーは、入力したい内容と直したい内容を途切れなく話し続けるだけでよく、システムが本文入力、編集指示、AIへの指示を自動的に判別し、作業中の内容へ即座に反映する。書いている最中でも声を重ねるだけで修正できるため、思考を止めずに内容を生成・編集しながら作業を進めることができる。これにより、従来の音声入力が苦手としてきた「入力後の修正」や「生成結果への細かな指示」を、キーボードやマウスに戻ることなく音声だけで扱えるようにする。最終的には、この技術を主要な環境で日常的に利用できる音声入力基盤として社会実装し、人間の思考や意図をAIへ高速に伝えるための新しい入力手段として普及させることを目指す。
本提案は、音声のみでリアルタイムに文章化および修正を完結させ、キーボード依存からの脱却を目指すAI時代の新たな入力インターフェースの開発である。
既存のLLMを活用した文字起こしツールとは一線を画し、ユーザーの発話とシステム出力を同時並行で処理する「フルデュプレックス方式」により、声による即時編集・上書きという極めてユニークかつ実用的な体験を実現する点に高い新規性と意義が認められる。
提案チームはすでに、日本語特化音声LLMのプロトタイプを開発しており、技術的な実現可能性は極めて高い。事業化計画の具体化や競合対策など、今後のブラッシュアップを要する点はあるものの、特定ドメインにおける次世代入力メソッドとしての市場優位性や、ビジネスへの発展性は非常に高いと評価し、本提案を採択とする。
2026年6月30日
未踏アドバンスト事業:2026年度上期実施プロジェクト概要(菅野・堤・山口・安藤PJ)を掲載しました。