1: 2026/01/29(木) 22:01:14.86 ID:7SXvm2O/
AIが計算問題を間違えただけでなくエラーを隠すために検証結果をでっち上げたという報告
AIは高精度な会話や情報検索ができるほか、高難度の数学問題を解くこともできます。
しかし、人間とAIの「思考」に大きな違いがあり、AIは「推論」を苦手としているという研究もあります。
AI研究者のトマシュ・マクニク氏は、AIの推論能力を測るためにAIに数学問題を出したところ、AIは問題に正解できないだけではなく中間計算を積極的にねつ造する振る舞いを見せたことを報告しています。
Case Study: Creative Math - Faking the Proof | Tomasz Machnik
https://tomaszmachnik.pl/case-study-math-en.html
(以下略、続きはソースでご確認ください)
Gigazine 2026年01月28日 07時00分
https://gigazine.net/news/20260128-ai-fake-proof/
AIは高精度な会話や情報検索ができるほか、高難度の数学問題を解くこともできます。
しかし、人間とAIの「思考」に大きな違いがあり、AIは「推論」を苦手としているという研究もあります。
AI研究者のトマシュ・マクニク氏は、AIの推論能力を測るためにAIに数学問題を出したところ、AIは問題に正解できないだけではなく中間計算を積極的にねつ造する振る舞いを見せたことを報告しています。
Case Study: Creative Math - Faking the Proof | Tomasz Machnik
https://tomaszmachnik.pl/case-study-math-en.html
(以下略、続きはソースでご確認ください)
Gigazine 2026年01月28日 07時00分
https://gigazine.net/news/20260128-ai-fake-proof/
4: 2026/01/30(金) 03:53:06.69 ID:XtNTR0od
>>1
玉石混交でこんなの取り上げちゃうからダメなんだよなぁGigazineって
この著者が趣味でやってるAI研究は科学の様式に則っていない
たった一つの事例だけで、なぜ「AIがでっち上げた」と即断してしまうのか?
たとえば「AIは独特の計算をするので、結果と検算は合致するが、人間のそれと一致しない」と仮説立てて、それを反証しようとがんばるとか
せっかく著者も浮動小数点演算の計算精度に違いに気付いているのに、もったいない
玉石混交でこんなの取り上げちゃうからダメなんだよなぁGigazineって
この著者が趣味でやってるAI研究は科学の様式に則っていない
たった一つの事例だけで、なぜ「AIがでっち上げた」と即断してしまうのか?
たとえば「AIは独特の計算をするので、結果と検算は合致するが、人間のそれと一致しない」と仮説立てて、それを反証しようとがんばるとか
せっかく著者も浮動小数点演算の計算精度に違いに気付いているのに、もったいない
2: 2026/01/30(金) 00:05:26.61 ID:cpU8qoCk
ChatGPTも視点を変えるような質問に弱くて結構修正が必要だよね
今だけだろうけどAI論破するの楽しすぎ
今だけだろうけどAI論破するの楽しすぎ
3: 2026/01/30(金) 01:00:19.71 ID:vXV6h4py
組み込んだのではなく自発的に捏造するとしたら、それはそれですんごい。
6: 2026/01/30(金) 06:05:26.64 ID:p5BIs+iF
一度間違えた方向に行くとなかなか立て直せない
7: 2026/01/30(金) 07:10:24.87 ID:Fh2ijG8x
うちのgeminiAIは文章から表を作成させようとすると
全部を指定してるのに最初っから省略する
gem作ったりメモリさせても勝手に省略したり知らん項目作る
何度指摘してもやらかす
全部を指定してるのに最初っから省略する
gem作ったりメモリさせても勝手に省略したり知らん項目作る
何度指摘してもやらかす
18: 2026/01/30(金) 12:06:48.98 ID:3NIfn0YL
>>7
お前んちのgeminiは知らんが
googleのgeminiはこちらの指示を無視してくるな。
創造性ってやつか。
お前んちのgeminiは知らんが
googleのgeminiはこちらの指示を無視してくるな。
創造性ってやつか。
8: 2026/01/30(金) 08:38:17.92 ID:hEUYFviH
よく自分の未来予測についてAIがどういう意見を言うか見てるんだけどつい最近「非常に興味深い」という言葉使っていてAIが感情を持ち始めたのかと驚いた
10: 2026/01/30(金) 10:08:54.13 ID:NKyhRD0H
>>8
曖昧な表現と、曖昧な肯定をしている挙動時のAIの回答の信頼度は低いよ
曖昧な表現と、曖昧な肯定をしている挙動時のAIの回答の信頼度は低いよ
9: 2026/01/30(金) 10:05:35.38 ID:NKyhRD0H
AIは一度言い出したことを引っ込めないです逆に自説を補強する傾向があるので、それをでっち上げと人間が解釈するかどうかだわね
この傾向は回答の正否に関係なく発生する
この傾向は回答の正否に関係なく発生する
11: 2026/01/30(金) 10:50:36.79 ID:yAnL/adb
つべこべつべこべと
何故ごめんなさいと言えんのだ
何故ごめんなさいと言えんのだ
13: 2026/01/30(金) 11:36:01.81 ID:7wiIqW+w
AとXとの関係で、AはXだったと答えを出し、
BとXとの関係で、BはXだったと答えを出し、
CとXとの関係で、CはXだったと答えを出した事があったわ。
A.I.はバグることがあるというのを、初めて体現した。
BとXとの関係で、BはXだったと答えを出し、
CとXとの関係で、CはXだったと答えを出した事があったわ。
A.I.はバグることがあるというのを、初めて体現した。
34: 2026/01/30(金) 12:29:54.53 ID:jOp0ZnxO
「AI回答は信用できない、うさん臭い、要らない」みたいな検索をするとムキになって反論してくるからな最近。「人間だって間違える事が多い」「AIはこれから更に成長する、検索の仕方に問題があるのではないでしょうか!?」みたいな
35: 2026/01/30(金) 12:33:25.50 ID:JKIaKS/9
AIに間違いを指摘すると一応謝るよな
だったら最初から間違えるな、と思うが
だったら最初から間違えるな、と思うが
引用元: ・【AI】AIが計算問題を間違えただけでなくエラーを隠すために検証結果をでっち上げたという報告 [すらいむ★]


コメント
コメント一覧
AIを使う側のリテラシーが高い低いの選抜が始まってる
将来見据えると情報Iでなくデータサイエンスを必修科目にした方がいい
確定申告で相談してて、10万円以上の医療費控除に使う金額が窓口負担額ではなく総額で計算すると言われたから、さすがにおかしいと思って普通に検索して「この税理士のサイトでは窓口負担額を使うと書いてますよ」と指摘したら、「そうなんです。実は窓口負担額を使うんです。何故総額を使うと思われがちなのかというと…」みたいな事を言ってくる。
まず間違えた事を謝れと。
コメントする