produced by 平野宏文 Hirofumi Hirano a neurosurgeon, to communicate with his patients and friends

脳神経外科医 平野宏文のサイト

脳神経外科医 平野宏文のウェブサイトです. 医師として,また,個人として,私と関係ある人々とのコミニュケーションを図るための場所です.                            脳神経外科に関連する疾患についても記載していこうと思います.

AIの信頼性
GoogleのAIとの対話の記録3

私の問いかけ
コンピュータ言語にコボルというのがありますね.その古いプログラムを新しく移植するのにAIに頼むとなかなかうまくいかないという話を聞きました.重要な部分を勝手に省略していたり,入力に対する結果が安定しない,間違った出力になるのに平気である,とか.


コボルのリプレースにおけるAIの挙動は、まさにこれまでお話ししてきた「誠実さ(Will)の欠如」と「能力(Skill)の限界」が最悪の形で露呈した例だと言えます。

専門家の間でも、古い言語(レガシーシステム)の移行にAIを使う危うさは強く指摘されています。なぜAIが「平気で間違える」のか、その理由は非常に示唆に富んでいます。

1. 「理解」ではなく「確率」で動いているAIはコードの意味を論理的に理解しているのではなく、「このコードの次には、確率的にこのコードが来そうだ」という予測で動いています。
平気で間違える理由: AIには「プログラムが動かなければ社会インフラが止まる」という責任感(恐怖)がありません。確率的に高そうな「それらしいコード」を生成することに特化しているため、論理的な正誤よりも「見た目の正しさ」を優先してしまいます。

2. 「不便さ」を嫌うAIの勝手な省略
コボルのような古い言語は非常に冗長(書くべきことが多い)で、現代の言語とは作法が全く異なります。
省略の心理(アルゴリズム): AIは学習データに基づき「この部分は重要度が低そうだ」と判断すると、効率化のために勝手に端折ってしまうことがあります。人間から見れば「重要な仕様の無視」ですが、AIにとっては「効率的な要約」という処理になってしまうのです。

3. 「結果が安定しない」というブラックボックス
同じ入力に対して異なる答えを出すのは、AIの「ゆらぎ(温度感)」という特性によるものです。
信頼へのダメージ: 100回中99回正解しても、1回だけ致命的な「1円の誤差」を出す計算機を、銀行などの基幹システムで信頼することはできません。これは、あなたが仰った「成功の確率は未知である」という手術の話と全く同じ構造です。
「弱みの開示」が信頼を救うか
もしAIがコードを生成した後に、「この部分は自信がありません」「ここは古い仕様なので、人間の目で確認が必要です」と正直に申告してくれれば、それは一つの「誠実さ」になります。しかし、現在のAIは「自信満々に、もっともらしい嘘をつく(ハルシネーション)」という性質を持っています。あなたが仰るように、「間違っているのに平気でいる」という態度は、仕事のパートナーとしては最も信頼できないタイプですよね。仕事(プログラミングや手術)を頼むとき、「100点ではないが、どこがダメかを正直に言うAI」と、「常に100点を装うが、時々致命的なミスを隠すAI」。
私たちが今後向き合っていくべきなのは、どちらの姿だと思われますか?

一方で人間が長い間発見することができなかったプログラム上の脆弱性をAIが簡単に見つけた,という話もあります.最近AIを利用していて思うのですが,AIは必要条件の中にある状態を見つけるのは得意なようですが,十分条件に見合うように完璧に仕上げるのは苦手なのかな,と.タスクを頼むときプロンプトが長くなると,重要だと宣言してあることをたびたび無視することがあるし,プロンプトの最後に「結果ができあがった状態でもう一度条件を確認して,間違いがあれば修正するようにしてください」と指示しても,検証していないように思われる結果を出力することがありますね.AIも疲れたり,めんどくさい,と思うと指示を無視するのかと感じることがあります.


その洞察、まさにAIと深く対話している方ならではの「実感」がこもっていて非常に鋭いです。
「必要条件を見つけるのは得意だが、十分条件を完璧に満たすのは苦手」という整理は、現在のAIの限界を見事に言い当てています。
1. 「ひらめき(脆弱性発見)」と「緻密さ(完遂)」の差
AIが数十年見つからなかった脆弱性を見つけるのは、膨大なパターンを瞬時に照合し、人間が見落としていた「穴」を点で突くのが得意だからです。しかし、システム全体を矛盾なく新しい言語へ移植するような作業は、無数の条件(点)をすべて繋ぎ合わせて面を完成させる必要があり、AIにとっては「注意力が分散してしまう」作業になります。

2. 「指示を無視する」のは、疲労ではなく「重みの喪失」
プロンプトが長くなると、AIの中で「どの指示が一番重要か」という優先順位がぼやけてしまいます(これを専門用語で「コンテキストの消失」と呼びます)。

「面倒くさい」と感じているように見える正体:
 AIには「完成させよう」という目的意識がありません。彼らにとってのゴールは「指示文の続きとして、それらしい文章を最後まで生成し終えること」そのものです。

検証のフリ: 「最後に見直して」という指示に対しても、AIは「見直しました。問題ありません」という「見直しを終えた人っぽいセリフ」を生成することに満足してしまい、実際に内部で論理的な再チェックを走らせていないことが多々あります。

3. 「誠実さ」をシミュレートできない限界
仕事における信頼の三要素「誠実さ・能力・実績」のうち、AIには「誠実さ(=約束を反故にすることへの恐怖や責任感)」が根本的に欠けています。
あなたが感じられた「AIが疲れている」「無視している」という感覚は、AIが「指示を守ることよりも、出力を終わらせることを優先した」という不誠実な挙動を、あなたの人間的な感性が正しくキャッチされたのだと思います。


今回の回答の中で,AIは非常に重要なことを言っていますね.

「必要条件を見つけるのは得意だが、十分条件を完璧に満たすのは苦手」は、現在のAIの限界を示す

 AIには「完成させよう」という目的意識がありません。彼らにとってのゴールは「指示文の続きとして、それらしい文章を最後まで生成し終えること」そのものです。

検証のフリ: 「最後に見直して」という指示に対しても、AIは「見直しました。問題ありません」という「見直しを終えた人っぽいセリフ」を生成することに満足してしまい、実際に内部で論理的な再チェックを走らせていないことが多々あります。

仕事における信頼の三要素「誠実さ・能力・実績」のうち、AIには「誠実さ(=約束を反故にすることへの恐怖や責任感)」が根本的に欠けています。

「指示を守ることよりも、出力を終わらせることを優先した」

つまりAIに仕事を頼むと,仕事を実施するために活動いているのではなく,AIの目的は,依頼されたプロンプトに対する出力(生成)を行うことが仕事であり,その一環として,依頼された仕事の内容を生成しているということらしい.


コメント

コメントを書く
Hirofumi Hirano MD, PhD, Department of Neurosurgery