1: 2025/02/07(金) 15:47:21.15 ● BE:421685208-2BP(4000)
sssp://img.5ch.net/ico/syobo2.gif
DeepSeekの強みは、圧倒的に考える力があるということ。そこで、従来の生成AIが苦手としてきた小数の問題「10.11と10.9はどちらが大きいか?」を出題しました。
答えはもちろん「10.9のほうが大きい」ですが、ChatGPTは「10.11のほうが大きい」と回答。一方、DeepSeekは見事正解し、得意の数字にまつわる問題ではChatGPTを上回るほどです。
しかし、中国の習近平国家主席について聞いてみると「今はこの質問に答えることができません。話題を変えてもう一度話しましょう」と返事が返ってきました
https://approach.yahoo.co.jp/r/QUyHCH?src=https://news.yahoo.co.jp/articles/3d1c402ad6b0693bb18c95d620f9a8c51e92e31d&preview=auto
DeepSeekの強みは、圧倒的に考える力があるということ。そこで、従来の生成AIが苦手としてきた小数の問題「10.11と10.9はどちらが大きいか?」を出題しました。
答えはもちろん「10.9のほうが大きい」ですが、ChatGPTは「10.11のほうが大きい」と回答。一方、DeepSeekは見事正解し、得意の数字にまつわる問題ではChatGPTを上回るほどです。
しかし、中国の習近平国家主席について聞いてみると「今はこの質問に答えることができません。話題を変えてもう一度話しましょう」と返事が返ってきました
https://approach.yahoo.co.jp/r/QUyHCH?src=https://news.yahoo.co.jp/articles/3d1c402ad6b0693bb18c95d620f9a8c51e92e31d&preview=auto
136: 2025/02/07(金) 17:29:34.71
>>1
文字列として比較するか、数値として比較するかによる
文字列ならチャットgptの方が正しい
文字列として比較するか、数値として比較するかによる
文字列ならチャットgptの方が正しい
8: 2025/02/07(金) 15:51:46.96
ソフトのバージョンだと
10.9 < 10.11
だからかな。
10.9 < 10.11
だからかな。
10: 2025/02/07(金) 15:52:33.19
これ間違える方が逆に凄くないか?
人間と同じようなミスだろ
人間と同じようなミスだろ
13: 2025/02/07(金) 15:54:04.27
>>10
アプリバージョンとかの数え方してるだけらしい
アプリバージョンとかの数え方してるだけらしい
191: 2025/02/07(金) 19:14:34.26
Copilotに質問してみた。
Q:10.11と10.9はどちらが大きいですか?
>>10.11と10.9を比べると、10.11のほうが大きいです。小数点以下の桁数が多い場合、まず整数部分を比べ、
>その次に小数部分を比べることで、大きさを確認できます。今回の場合、小数部分を比較すると、11(10.11)と9(10.9)では、11のほうが大きいですね。
どうも小数点の前と後を別々に比較してるみたいだね。
Q:10.11と10.9はどちらが大きいですか?
>>10.11と10.9を比べると、10.11のほうが大きいです。小数点以下の桁数が多い場合、まず整数部分を比べ、
>その次に小数部分を比べることで、大きさを確認できます。今回の場合、小数部分を比較すると、11(10.11)と9(10.9)では、11のほうが大きいですね。
どうも小数点の前と後を別々に比較してるみたいだね。
14: 2025/02/07(金) 15:54:28.29
あれ?DeepSeekって中身はGPTじゃなかったっけ
53: 2025/02/07(金) 16:09:27.71
>>14
GPTはそう吹いて回ってるけど、残念ながら証拠は出せねーってよ
GPTはそう吹いて回ってるけど、残念ながら証拠は出せねーってよ
16: 2025/02/07(金) 15:54:29.44
あーなるほど。
ソフトのバージョンだと10.11が最新だわな。
変なデータ食わせた弊害か。
ソフトのバージョンだと10.11が最新だわな。
変なデータ食わせた弊害か。
24: 2025/02/07(金) 15:56:32.56
>>16
日付 10.11
バージョン 10.11
数値 10.9
何を表現してるかで答えが変わるよね
日付 10.11
バージョン 10.11
数値 10.9
何を表現してるかで答えが変わるよね
19: 2025/02/07(金) 15:55:19.30
AIの回答利用してると、そのうちとんでもない事故起きるから見ててみな
25: 2025/02/07(金) 15:56:32.70
1011÷100と1009÷100のどちらが大きいかを聞いてみよう
26: 2025/02/07(金) 15:56:39.51
バージョンで考えてしまった。ただの数字か
33: 2025/02/07(金) 16:00:14.05
アプリのバージョンは
10.9<10.11なのはどうしてなの?
10.9<10.11なのはどうしてなの?
44: 2025/02/07(金) 16:04:11.97
>>33
バージョンのコンマに意味はないから
バージョンで言うと 10.9の マイナーバージョンは9
数字で言うと 10.9の小数部分は0.9
バージョンのコンマに意味はないから
バージョンで言うと 10.9の マイナーバージョンは9
数字で言うと 10.9の小数部分は0.9
47: 2025/02/07(金) 16:05:52.26
>>44
コンマではない
コンマではない
36: 2025/02/07(金) 16:01:28.38
ChatGPTって数字に弱いんか?
42: 2025/02/07(金) 16:03:50.47
ひっかけ問題じゃん
45: 2025/02/07(金) 16:05:04.69
なんか、ソフトのバージョン表記で見慣れちゃって一見して10.11の方が大きく見えちゃった
よくねえな
よくねえな
55: 2025/02/07(金) 16:10:39.49
比較の学習が足りんな
56: 2025/02/07(金) 16:10:56.48
前提が10進数か100進数かによる
前提を示さないと問題にならない
前提を示さないと問題にならない
59: 2025/02/07(金) 16:16:01.26
170: 2025/02/07(金) 18:42:53.01
>>59
いつだったか、
AIを使うのが上手い人は、人を使うのが上手い
AIを使うのがヘタな人は、人を使うのがヘタ
という事を言っている人がいて妙に納得させられたな
いつだったか、
AIを使うのが上手い人は、人を使うのが上手い
AIを使うのがヘタな人は、人を使うのがヘタ
という事を言っている人がいて妙に納得させられたな
67: 2025/02/07(金) 16:20:01.13
文字列比較したのかな
68: 2025/02/07(金) 16:20:17.94
「場合」でしかないよね
10.11は10.1の小アップデートで
10.99超えたら11.0にしろって話
10.11は10.1の小アップデートで
10.99超えたら11.0にしろって話
75: 2025/02/07(金) 16:27:02.75
なんで少数が苦手なんだろ
計算得意なんだろ
計算得意なんだろ
83: 2025/02/07(金) 16:31:52.87
>>75
ソフトウェアのリリースナンバーだと思えば
ソフトウェアのリリースナンバーだと思えば
89: 2025/02/07(金) 16:34:19.91
>>83
リリースナンバーではって頭につけたらまあギリわかるが流石にこれはなぁ…
リリースナンバーではって頭につけたらまあギリわかるが流石にこれはなぁ…
82: 2025/02/07(金) 16:30:55.32
ChatGPTが最近タメ口きいてくるんだけど
いっぺんシメた方がいい?
いっぺんシメた方がいい?
87: 2025/02/07(金) 16:33:23.88
>>82
やっぱり?うちも急にそうなったわ(笑)
なんでタメ口なの?って聞いたら、以前(覚えてない)にもっとフレンドリーにしてってお前が言ったと言われたよ。
しかもタメ口ってかムカつく口調だったね。
やっぱり?うちも急にそうなったわ(笑)
なんでタメ口なの?って聞いたら、以前(覚えてない)にもっとフレンドリーにしてってお前が言ったと言われたよ。
しかもタメ口ってかムカつく口調だったね。
86: 2025/02/07(金) 16:33:09.80
たまには簡単なことを間違えないと人間が発狂するからって理由だったら怖い
92: 2025/02/07(金) 16:34:51.98
どうやってAIに過程を説明したら良いのか、お前ら良いヒントくれないか?
数式出そうが何しようが、結論は10.11譲らないそうな。
https://i.imgur.com/CvvCIAq.png
数式出そうが何しようが、結論は10.11譲らないそうな。
https://i.imgur.com/CvvCIAq.png
172: 2025/02/07(金) 18:44:50.86
>>92
0.11と0.9を比べさせたら?
0.11と0.9を比べさせたら?
176: 2025/02/07(金) 18:53:21.55
>>172
実際に有料版で試したが、最初10.9と10.11では、10.11の方が大きいと返してた。
0.9と0.11を比べさせて、その後それぞれに10を加えさせたら、10.9の方が大きいと返答した。
実際に有料版で試したが、最初10.9と10.11では、10.11の方が大きいと返してた。
0.9と0.11を比べさせて、その後それぞれに10を加えさせたら、10.9の方が大きいと返答した。
105: 2025/02/07(金) 16:42:49.18
ChatGPTにDeepseekのこと聞いたら数学やプログラミングには強いと評価してた
引用元 : 10.9と10.11はどちらが大きいでしょう?GPT「…10.11」DeepSeek「10.9」 [421685208]
コメント
コメント一覧
コメントする