立即注册 登录
汉山 返回首页

翰山的个人空间 https://hanshan.info/?2 [收藏] [复制] [分享] [RSS]

日志

最近十年中国GDP占美国的比例,问问AI --- AI 的一个测试例子

已有 98 次阅读2025-1-24 11:57 |个人分类:政论文章|系统分类:原创博文 | 宽屏 请点击显示宽屏,再点击恢复窄屏 | 动漫全图 如只见部分动漫,请点击显示全图,再点击恢复窄图

【前注】最近写了两篇AI的文章,发现AI吹的很高,其实非常不成熟。下面三篇文字作为一个现阶段对AI的认识:
正文

我询问了五个AI,
【注】我开始分析对比了两个AI,CHat DPT 和 中国字节跳动的 豆包。因为网上争吵中国另一款AI,深度搜索,于是加上,同时也把马斯克的和微软的驾驶助手也加上,作为比较。
  1. ChatGPT --- OPenAI 旗下 AI 智能助手
  2. 豆包 - 字节跳动旗下 AI 智能助手
  3. DeepSee 深度搜索
  4. Grok / X --- 马斯克
  5. Copilot | Microsoft 365 Copilot --- 微软
  6. 我的分析总结



2,豆包




运行这个phthon程序之后,得到下图,显然这个程序无法控制中文文字:


可见:豆包的作图能力不如ChatGPT


3,DeepSee 深度搜索





4,Grok / X --- 马斯克


马斯克的,可以做图,但是所做的图与主题风马牛不相及

5,Copilot | Microsoft 365 Copilot --- 微软


微软的做不出来图。


4,我的分析和总结

根据AI数据,我用excell做的表格和图

两个AI,Chat GPT和豆包,数据都比较靠谱:




五个AI,加上,深度搜索,马斯克的Grok, 微软的 驾驶助手:

微软的数据不靠谱,深度搜索 和 Grok 近两年数据没有搜集,有偏差:


鲜花

真棒

玩闹

同情

看看

困惑

震惊

bad

发表评论 评论 (6 个评论)

回复 翰山 2025-1-27 11:39
这篇文章始于一个不经意的AI搜索,“中国GDP最近十年占美国比例列表”,以及做图。用了Chat GPT和豆包.

Chat GDP是因为有名气,豆包,是因为我在做视频等游戏场所一直在用豆包。
回复 翰山 2025-1-27 11:40
后来注意到,最近DeepSeek,深层搜索,在网上争论很热烈。我没有参与甚至注意这个争论,但是不妨把我的这篇文章略扩大,把比较深层搜索包括其中。
回复 翰山 2025-1-27 11:41
从数据来讲,ChatGPT和豆包都是比较靠谱的,趋势相同,差别是细小的。但做图,ChatGPT可以完成,豆包仅仅给出了程序,略差一筹。

原以为这个代表AI的普遍性,引入 深度搜索后,发现它的数据略差,不仅是数据,趋势也不对。但是画图功能也凑合,与豆包雷同,虽不能画出图,但能给出程序。
回复 翰山 2025-1-27 11:42
深度搜索的数据比较差,这引起了我的兴趣,想看看其它AI工具如何,就又加上了微软的 驾驶助手,这是我在公司装备的有执照的AI工具。同时,又加上了马斯克的Grok 2。看看它们表现如何。
回复 翰山 2025-1-27 11:43
没有想到,微软的 驾驶助手,和马斯克的Grok 2,表现很差,

第一,完全不能做图,一个简单的excel二维图;

第二,甚至数据收集都懒于完成,微软的完全不靠谱;马斯克的今年偏差很大。
回复 翰山 2025-1-27 11:44
这大概代表了AI的真实水平:

你可以用AI达到某个确定的目标,对于这个目标,如果达成之后,人们可以反复享用。但是任意给一个目标,它不一定能完成。

facelist doodle 涂鸦板

您需要登录后才可以评论 登录 | 立即注册

Archiver|手机版|小黑屋|汉山网    

GMT-5, 2025-2-9 00:05 , Processed in 0.047497 second(s), 23 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

返回顶部