デジタル人材の育成
公開日:2025年6月30日
近年、大規模言語モデル(LLM)を活用したAIチャットシステムが急速に普及する一方、プロンプトインジェクションなどLLM固有の攻撃手法による新たなセキュリティリスクが顕在化している。たとえば、内部プロンプトの上書きによって機密情報が漏洩したり、生成されたテキストが意図せずコードとして実行されることでクロスサイトスクリプティングやリモートコード実行が発生する事例が報告されている。LLMは極めて多様かつ動的な表現を生成するため、従来のキーワード検知や静的なルールに基づく防御策では、こうした巧妙な攻撃を防ぎきれないのが実情である。
本プロジェクトでは、LLM特有の脆弱性を自動かつ継続的に診断するSaaS型プラットフォームを開発し、誰もが安全にAIチャットを活用できる社会の実現を目指す。このプラットフォームの核となるのは互いに連携する二つのAIである。第一の「攻撃AI」は攻撃者の思考パターンを模倣して多様な攻撃プロンプトを自動生成し、対象システムに対して継続的に疑似攻撃を仕掛ける。第二の「検証AI」は、その応答を多面的に解析し、未知の脅威を即座に検出するとともに、リスクを正確に分類・定量化する。
本プラットフォームは直感的な管理画面と自動レポーティング機能を備え、専門知識がなくても自社のAIチャットの脆弱性を容易に診断できる。将来的には、機密情報や社内データを外部に送信できないケースを想定し、オンプレミスで動作するローカルLLMへの対応も視野に入れる。これにより、高度なセキュリティ要件を持つ企業でも安心して利用できる包括的な脆弱性診断ソリューションとして展開していく。
生成AIを中心としたAIの普及に伴うリスク増大は喫緊の課題である。本提案は、提案者らの日本語特有攻撃知見、国際会議での実績といった高い技術力があることが見受けられる。AIによる疑似攻撃自動化は、従来の手法では困難な網羅的かつ継続的な脆弱性評価を実現し、AI安全確保に極めて価値が高いと判断した。そのため、未踏アドバンストに相応しく、採択と判断した。
2025年6月30日
2025年度上期採択プロジェクト概要(辻󠄀・杉山PJ)を掲載しました。