ChatGPT4无法获得麻省理工学院学位
2023-06-27 15:58:16 互联网
导读 OpenAI的ChatGPT是一个很棒的工具,尽管在几个方面存在缺陷。利用大语言模型(LLM)的功能,同时保持其在周边视觉方面的局限性,是目前正确的...

OpenAI的ChatGPT是一个很棒的工具,尽管在几个方面存在缺陷。利用大语言模型(LLM)的功能,同时保持其在周边视觉方面的局限性,是目前正确的方法。

最近,一篇论文声称ChatGPT-4在MIT的EECS课程中可以取得100分的成绩,引起了轰动。然而,随之而来的是一个不道德的数据来源和反复提示以获得期望结果的肮脏故事。让我们更深入地研究一下。


【资料图】

几天前,IddoDrori教授发表了一篇题为“使用大型语言模型探索MIT数学和EECS课程”的论文。该论文仔细审查了“包含4,550个问题和解决方案的综合数据集,这些问题和解决方案来自问题集、期中考试和期末考试,涉及获得学位所需的所有麻省理工学院数学、电气工程和计算机科学(EECS)课程。”该论文的结论令人震惊:

“我们的结果表明,GPT-3.5成功解决了整个MIT课程的三分之一,而GPT-4通过及时的工程设计,在排除基于图像的问题的测试集上实现了完美的解决率。”

鉴于这些令人震惊的说法,这篇论文在社交媒体上疯传,一天之内就获得了500多次转发。

随后,劳纳克·乔杜里(RaunakChowdhuri)和他的同事对该报纸的说法进行了审查。与论文的主张相反,乔杜里发现所使用的方法存在明显的问题:

该数据集包含10个无法解决的问题。这意味着ChatGPT-4正在按照提示提供解决方案,或者问题没有正确评分。经过更深入的检查,Chowdhuri发现ChatGPT确实通过所谓的“少数示例”在提示中泄露了解决方案,这些示例是作为附加上下文提供给模型的问题及其解决方案。

源代码中的拼写错误和错误会污染提示并导致与论文本身描述的结果不同的结果。

由于交换了参数,特别是当涉及到零样本函数时,模型会返回无法分级的混乱响应。

该论文声称ChatGPT的响应经过了手动双重验证。然而,Chowdhuri发现该程序正在使用“记录的正确答案来指导其行动”,即何时在零样本学习和少样本学习之间切换。

此外,多位麻省理工学院教授随后发表声明,披露该论文未经授权来源于麻省理工学院数据集:

“6月15日,IddoDrori在arXiv上发布了一篇与麻省理工学院数十门课程的考试和作业数据集相关的工作论文。他在没有得到许多合著者同意的情况下这样做了,尽管他被告知在出版前应该纠正一些问题。”

免责声明:本文由用户上传,如有侵权请联系删除!

热门推荐

文章排行

  1. 2023-06-27ChatGPT4无法获得麻省理工学院学位
  2. 2023-06-27环球讯息:唐山市路南区总工会开展“劳动创造幸福”收纳整理活动
  3. 2023-06-27【世界时快讯】央视网视频直播2023年世界女排联赛水原站
  4. 2023-06-27公元股份:6月26日融券卖出金额32.22万元,占当日流出金额的1.03%
  5. 2023-06-27路南、路北这15所小学、初中将有大变化! 速读
  6. 2023-06-27焦点关注:端午订单涨幅近60% 避暑游、龙舟游火爆
  7. 2023-06-27全球热点评!谁是水货谁最超值?近十年NBA状元秀 有人夺冠有人早早淡出联盟
  8. 2023-06-27售价33.5万元,硬派越野坦克500 Hi4-T正式全擎上市-天天速递
  9. 2023-06-27复合型医学人才,不仅仅能当医生
  10. 2023-06-27菲亚特宣布未来不再提供灰色车漆 理由却让人哭笑不得
  11. 2023-06-27“漂流+观光+避暑度假” 望龙山复合型旅游项目 助推庆安县文旅产业融合发展
  12. 2023-06-27大连商品交易所征集新一批产融培育基地-蛋鸡现货龙头企业标准
  13. 2023-06-27阳神定档,中原五白梦入神机霸气出关,网友直言还好没交给玄机做
  14. 2023-06-27微动态丨恒生指数午后涨幅扩大至2%
  15. 2023-06-276月27日 13时40分 廊坊发展(600149)强势封涨停_每日快播
  16. 2023-06-27焦点热文:中国石化获浅层常压页岩气突破
  17. 2023-06-27ST通脉6月27日打开涨停 观速讯
  18. 2023-06-27天天速读:审批时间仅用2个工作日 减少40个工作日 河南省首例水影响评价“三合一”项目获批
  19. 2023-06-27环球视点!农业农村部公示151家企业重点实验室,湖北省神丹等7家企业上榜 当前关注
  20. 2023-06-27天安人寿保险百万医疗怎么样?可以单独买吗?|新动态