立即注册 登录
汉山 返回首页

翰山的个人空间 https://hanshan.info/?2 [收藏] [复制] [分享] [RSS]

日志

AI 几何,80%都出错 --- 一个AI的负面例子

已有 252 次阅读2025-1-30 18:14 |个人分类:Tech|系统分类:原创博文 | 宽屏 请点击显示宽屏,再点击恢复窄屏 | 动漫全图 如只见部分动漫,请点击显示全图,再点击恢复窄图

【前注】从去年底开始用AI,发现AI被吹的很高,其实非常不成熟。
【注】本文是我接触学习AI的系列文章之一,与最近热炒 深度搜索,无关。对于深度搜索,我个人觉得没有必要发言或评述。继“汉芯一号”,“厉害了我的国”,“5G”,“鸿蒙”,“新能源汽车”,之后,深度搜索,仅仅是又一个炒作,而且热度期应该很短,不予评论。

下面三篇文字作为一个现阶段对AI的认识:

AI 几何,80%都出错 --- 一个AI的负面例子


这篇文章,是我两周前的一次偶然操作,当时问AI一个命题,“寻找需要四步以上证明的几何题”。结果发现,80%给出的命题都漏洞百出。于是,有了本文的题目。可惜的是,当时我没有截图成文,等有了闲暇,要缀字成文时,发现AI并不能完全复制以前的搜索结果。即,我无法复制我以前得到的错误。

好在,有两个明显的错误,我还记得。
  • “三角形外接圆的圆心到三角形各边距离相等。”
  • “等腰三角形ABC,AB=AC,BC上中点为D红色,证明三角形BDC也是等腰三角形”。
其中第一个,还做过搜索关键词。

我把上面两个搜索,输入到以下6个AI助手,三个国外,三个国内,包括深度搜索。每个搜索下面,附带一个做图要求。我们看看结果:
  1. ChatGPT --- OPenAI 旗下 AI 智能助手
  2. Grok / X --- 马斯克
  3. Copilot | Microsoft 365 Copilot --- 微软
  4. 豆包 - 字节跳动旗下 AI 智能助手
  5. DeepSee 深度搜索
  6. 文心一言 --- 百度旗下 AI 智能助手
总结:
我把总结写在这里。
第一个命题:
  • “三角形外接圆的圆心到三角形各边距离相等。”
由于命题本身是错的,所有的证明全部是错的。只有豆包分辨出了这个错误:
  • 判断对错:该说法错误。三角形外接圆的圆心是三角形三边垂直平分线的交点,这个点到三角形三个顶点的距离相等,而不是到三角形各边距离相等。到三角形各边距离相等的点是三角形内切圆的圆心,即三角形三条角平分线的交点。
并给出了正确的证明。做图全部失败,或者不能做,或者错误。请看,基本上不着边际。

第二个命题:
  • “等腰三角形ABC,AB=AC,BC上中点为D红色,证明三角形BDC也是等腰三角形”。
全军覆没,没有一个给出正确答案,指出BDC是一条直线,根本不是三角形。作图,深度搜索 给出了基本靠谱的图示,包括演示出BDC在一条直线上。

总评分:不及格。对于中等复杂的几何证明,80%以上是错误的。

搜索“三角形外接圆的圆心到三角形各边距离相等。”
  • ChatGPT --- OPenAI 旗下 AI 智能助手








搜索“等腰三角形ABC,AB=AC,BC上中点为D红色,证明三角形BDC也是等腰三角形”。


鲜花

真棒

玩闹

同情

看看

困惑

震惊

bad

发表评论 评论 (8 个评论)

回复 翰山 2025-2-12 09:26
AI 是一个不可靠的工具,至少目前如此。有些可以得到正确答案,但是如果随机出题,很可能不对。今天在问春节时就闹了笑话,还不知道。元宵,还是不行。
回复 翰山 2025-2-12 09:27
这是微信:
回复 翰山 2025-2-12 09:37
上面这个时昨天的微信。问Chat GPT元宵节,第一给问题,还可以,但举例2023,正确。

再问“今年呢”,第一个错误,回答的是2024。无论公历农历,今年都和2024无关。

再问:今年是2025年。元宵节回答是错误的。
回复 翰山 2025-2-12 09:44
回复 翰山 2025-2-12 09:45
上图是电脑上的 Chat GPT,还是错的。应该是2月12日。

可见AI是多么不可靠,必须要有人来矫正。显然,作为大数据训练,至少CHat GPT是不够的。没有注意国产的AI。
回复 翰山 2025-2-13 12:06
刚刚查验了一下马斯克旗下的Grok 2,失败:

回复 翰山 2025-2-13 12:07
微软的Copilot成功了:

回复 翰山 2025-2-13 12:09
顺便再回头看看国内热炒的 Deep Seek:结果很差:



问它,今年的元宵节,同样的问题问其他AI,它竟然不知道。
再问具体点,2025年的元宵节,它给出和马斯克的 Grok 2同样的错误,公历3月3日。不知道这个结果从何而来。由于和马斯克的一致,是不是存在抄袭或互相抄袭。大概马斯克抄袭的可能性很小,因为此前,他还不知道有一个 DeepSeek

facelist doodle 涂鸦板

您需要登录后才可以评论 登录 | 立即注册

Archiver|手机版|小黑屋|汉山网    

GMT-5, 2025-4-20 00:59 , Processed in 0.042895 second(s), 23 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

返回顶部