デジタル人材の育成
公開日:2024年6月25日
本プロジェクトでは、ニューラル言語モデルによる高度な個人最適化機能を有する日本語入力システムを開発する。既存の日本語入力システムは「変換精度」「個人最適化」「予測入力」の3点で不十分である。これらをニューラル言語モデルと「文脈」のデータベースによって解決することを提案する。
文脈データベースは本システムにおける個人最適化のために構築する。本システムは、趣味・職業・年齢などのプロフィールや、ユーザ自身が過去に執筆した文書、さらに画面録画や、ブラウザ拡張によって記録されたユーザが読んだテキストを、日本語入力システムのためにユーザの同意に基づく範囲で取得・整理して保持する。これらの情報により、ユーザの広義の「文脈」をシステムが理解できるようにする。
本システムではニューラル言語モデルを前提とした、かな漢字変換アルゴリズムを採用する。これらのモデルによって高度な意味理解に基づく正確な変換を実現する。さらに、ニューラル言語モデルのファインチューニングによってシステムの振る舞いを柔軟に変更できるようにする。これを文脈データベースと組み合わせることで、高度な個人最適化を実現する。ファインチューニングは処理に時間がかかるプロセスであるため、ルールベースの個人最適化手法を組み合わせるなどの工夫により、現実的に運用可能なシステムを構築する。日本語入力は高速かつ軽量な処理が重要なため、量子化や投機的デコーディングを活用し、高速かつ省メモリなシステムを実現する。
最後に、ニューラル言語モデルを基盤とする本システムで、数文単位の予測入力の実現を目指す。従来のシステムでは、ユーザの文脈の理解の欠如のため、期待される候補の提案が難しかったが、文脈データベースに基づいた個人最適化により、十分に有用な候補の提案ができると期待している。
本提案は、ニューラル言語モデルを活用して、個人に最適化された日本語入力システムの開発を目指すものである。提案者らは、既にAzooKeyKanaKanjiConverterの開発実績を有しており、本システムの実装を着実に進めることが期待できる。
提案されたアルゴリズムは、ユーザの活動データを収集しファインチューニングを行うことで、個人に最適化されたモデルを構築するものであるが、読み制約や投機的デコーディングを用いることで変換の高速化と精度向上も同時に目指すものであり、技術的な新規性が認められる。
ユーザテストについては、事前にデータを収集する必要があるため、実施には工夫が求められるが、提案者らの計画では十分に対応可能であると判断される。また、本システムの応用範囲は広く、通訳などへの活用も期待される。
二次審査のプレゼンテーションでは、システムの利用価値や利便性が明確に示され、納得感のある説明がなされた。今後は、クロスプラットフォームでの展開や音声入力への対応など、さらなる発展の可能性も示唆されている。
以上の理由から、本提案は採択するに相応しいと判断する。究極の日本語入力システムの実現に向けて、提案者らの挑戦に期待したい。
2024年6月25日
2024年度採択プロジェクト概要(三輪・高橋PJ)を掲載しました。