生成人工知能(AI)「チャットGPT」が作成した日本語の文章と人間が書いた文章は、犯罪捜査にも使われる統計的手法を使うと、正確に見分けられることが、目白大の財津亘(わたる)准教授(犯罪心理学)の研究で分かった。10日、米科学誌「プロスワン」オンライン版で発表した。
チャットGPTを巡っては、日本語でも自然な文章を作成できることから、学術論文やインターネット上でのなりすましなどに不正利用される懸念が高まっていた。英語での判別方法に関する論文はあるが、日本語では初めて。
文章を品詞に分解して助詞の使い方や読点の打ち方といった特徴を統計的に解析する「計量文体学」の知見を活用。心理学に関する日本語の論文72本について、チャットGPTに、「同じタイトルと分量で論文を書いてください」と依頼し、比較した。
その結果、隣り合う品詞の組み合わせ▽助詞の使い方▽読点(、)の打ち方▽「また」「この」といった単独で意味を持たない単語の割合−の4つの尺度で分析すると、チャットGPTと人間の文章には統計的に明確な違いがあることが浮き彫りとなった。
こうした違いをAIに学習させ、読点の打ち方に着目して論文を判別させると93.5%、4つの尺度すべてを総合して判別させると100%見分けることができた。
例えばチャットGPTの文章では「〇〇が、〜が…」といった並びが目立つほか、助詞「は」のあとに読点が打たれやすいこと、「本論文は」など「本」といった接頭語が使われやすいことが分かったという。
財津氏は富山県警科学捜査研究所の元主任研究官で、脅迫や誹謗中傷などの文章を書いた人物を特定する鑑定業務に従事してきた経歴を持つ。「チャットGPTが作成した文章は自然だが、人間が読んでも一見気づかないような『文章の指紋』をあぶりだすことで、現段階ではほぼ正確に、人間の手によるものか否かを見分けられる」と話した。
copyright (c) Sankei Digital All rights reserved.
「ITmedia エグゼクティブは、上場企業および上場相当企業の課長職以上を対象とした無料の会員制サービスを中心に、経営者やリーダー層向けにさまざまな情報を発信しています。
入会いただくとメールマガジンの購読、経営に役立つ旬なテーマで開催しているセミナー、勉強会にも参加いただけます。
ぜひこの機会にお申し込みください。
入会希望の方は必要事項を記入の上申請ください。審査の上登録させていただきます。
【入会条件】上場企業および上場相当企業の課長職以上