AIチェッカーとは?
AIチェッカーとは、文章や画像などのコンテンツが生成AIによって作られたかどうかを判定するためのツールである。学生のレポートや論文におけるAIの不正利用や、外部ライターから納品された記事の品質確認など、ルールを破っている人を見抜くための仕組みとして利用している人たちもいる。
具体的には、次のような評価方法がある。
第1に、「文章の予測困難度」で判定する。AIは統計的に次にくる確率が最も高い自然な単語をつなぎ合わせることで文章を生成する。すなわち、AIが学習した文章の総量から見たときに、その傾向と一致しているほど「AIによって生成された」と判断されるわけだ。
第2に、「文章の構造や長さのばらつき具合」で判断する。通常、AIが生成する文章の長さは均一であり、構造が論理的に整いすぎているとの前提から、「ドキュメントのリズム」が一定であるほど「AIによって生成された」と判定する。
第3に、生成AIが付与した「マークの有無」で評価する。例えば、Googleでは、AI 生成の画像、音声、テキスト、動画に「デジタル透かし(=SynthID)」を直接埋め込むことで、AI 生成コンテンツを識別している。
【GoogleのSynthIDに関する説明】
https://ai.google.dev/responsible/docs/safeguards/synthid?hl=ja
AIチェッカーの技術は不完全
しかし、AIチェッカーの技術は不完全である。文章の予測困難度を裏付けている根拠が確率的なものである以上、絶対的な指標にはならない。文章の構造や長さに関するばらつきも同様だ。
「もしかしたら、AIが作成したかもしれない」という中途半端な烙印を押す仕組みを使えば、その分野に精通した無駄のない美しい文章を書く人の能力を過小評価するリスクがある。したがって、現時点では、この類のAIチェッカーは、誤判定による弊害を避けられないため、使用する側は慎重になる必要があるだろう。
一方で、Googleの「SynthID」のような「デジタル透かし」は、生成AIの使用とコンテンツが不可分に結びついているため、「AIが作ったかどうか」を絶対的に判定するテクノロジーとして期待できる。ただ、「生成AI間での互換性の不在」や「パラフレーズ」によって、「デジタル透かし」を無力化できる以上、悪意のあるコンテンツ生成を見抜く技術としてはまだ道半ばにあると言わざるを得ない。これはGoogleの公式ドキュメントから見ても明らかなことだ。
SynthID テキスト ウォーターマークは、テキストの切り抜き、単語の変更、軽微な言い換えなどの変換に対して堅牢ですが、この方法には制限があります。- 透かしの適用は、精度を低下させることなく生成を拡張する機会が少ないため、事実に基づく回答では効果が低くなります。
- AI 生成テキストを徹底的に書き換えたり、別の言語に翻訳したりすると、検出機能の信頼スコアが大幅に低下する可能性があります。
SynthID Text は、悪意のある攻撃者が悪影響を及ぼすのを直接阻止するように設計されていません。ただし、AI 生成コンテンツを悪意のある目的で使用しにくくなり、他のアプローチと組み合わせて、コンテンツ タイプとプラットフォーム全体でカバレッジを改善できます。
Google『SynthID: 透かしを入れて LLM で生成されたテキストを検出するためのツール』より引用
自分で書いたのにAIチェッカーに引っかかるのはなぜ?
以上のことから、自分で書いたのにAIチェッカーに引っかかるのは、大きく2つの要因があると言える。
ひとつは、その文章が執筆のテーマにおける常識に準じているため、「文章の予測困難度」が低いからだ。ありきたりなドキュメントとも言えるし、ちゃんと業界を分析した結果をまとめた文章とも言える。ネットの情報を論理的にまとめただけならば、その労力とは無関係にAIチェッカーに引っかかる場合があるのだ。
もうひとつが、文章が整いすぎているがゆえに、不本意な判定をくらった可能性がある。特に、ブックライター並みの高度なドキュメント作成能力を有する人ならば、システマティックな文章を書く技術を持っている。けれども、それが仇をなして、AIチェッカーと相性が悪くなると考えられる。
AIチェッカーに引っかからない対処法
あくまでもAIチェッカーが示すのは、「確率の高さ」にすぎないが、クライアント側からすれば、「AIを使って楽をした」というネガティブな印象をもたらしかねない。その意味では、何らかの対処は必要だろう。
具体的に言えば、「予測困難度」と「構造の均一さ」を克服するには、独創的な視点に基づくオリジナルな文章を書く以外にない。要は、自分の癖を発揮したネットには存在しないテキストを用意する必要があるわけだ。現状、生成AIを活用した記事が大量にネットで登場していることを考えると、SEOの視点としても「独創性」は評価基準の重要なファクターになるだろう。
その意味では、だれでも書ける文章の価値は低くならざるを得ない。むしろ、それならAIに書かせたほうがはるかに効率がよく、コストも低い。実際、生成AIを活用して記事制作のコストダウンを図るのは容易だ。
「生成AIでWEBライターがオワコンだ」と囁かれるのは、テーマに紐づく需要に対して、すでにある答えを焼き直す作業としての「執筆」に留まるならば、人間が書くまでもないからだ。これが今の偽らざるWEBライティング業界のステータスだろう。
AIチェッカーを意識して書くのは馬鹿げている
とはいえ、AIチェッカーが人間とAIを選別する絶対的な基準とならない以上、信頼に値するツールとは言えない。むしろ、誤判定によるトラブルを引き起こすリスクのほうがはるかに大きいだろう。それに、AIチェッカーに引っかからないように小手先のテクニックを使うことも無駄なコストを発生させるだけのように思える。
そもそも、コンテンツが利用者や事業に対して「どのような価値をもたらすのか?」という問いにちゃんと答えているならば、人間がつくろうが、AIがつくろうが、そこに実利的な差分はない。
発注者側も、AIで楽をしたからといって受注者側を断罪するのは本末転倒だろう。
大切なことは、そのクリエイティブの効果を説明できることであり、そこに至る過程までをAIに丸投げしている場合、コンテンツの先は暗いはずだ。何度も言うが、これは人間だろうが、AIだろうが、同じ話だ。作業としてのコンテンツ作成ではなく、価値のもたらし方を想定した作り込みを確認していくことが、結果を出すためには避けては通れない。
私たちは今、AIと人間を対立させる問題に絡め取られるのではなく、その先にある価値創造を担保したコンテンツのあり方を問うていくことに集中すべきだと思う。