体育游戏app平台在臆测机还在用打孔纸带存储的年代-开云「中国内陆」官方网站更高效、更智能、更环保

栏目分类

新闻资讯: 关于我们; 产品中心; 新闻资讯; 在线招聘; 联系我们

热点资讯

欧洲杯体育也等于其后的唐德宗的副手领兵东征-开云「中国内陆」

体育游戏app平台我父兄死的冤枉？宇文门第代效忠于大梁-开云

开云(中国)Kaiyun·官方网站 - 登录入口比许多官家子

你的位置：开云「中国内陆」官方网站更高效、更智能、更环保 > 新闻资讯 > 体育游戏app平台在臆测机还在用打孔纸带存储的年代-开云「中国内陆」官方网站更高效、更智能、更环保

体育游戏app平台在臆测机还在用打孔纸带存储的年代-开云「中国内陆」官方网站更高效、更智能、更环保

发布日期：2025-08-27 03:58 点击次数：83

体育游戏app平台在臆测机还在用打孔纸带存储的年代-开云「中国内陆」官方网站更高效、更智能、更环保

先问群众一个问题体育游戏app平台，仅凭聊天，你能判断出对方是个若何的东谈主吗？

来望望这段聊天记载，你可能会得出论断，对方是个天地无敌大懒狗。

但如果我跟你说，对面根本就不是东谈主，你敢信？

这事儿，就跟科学史上的典中典，图灵测试关系。

一直以来，大伙王人把这测试当成估量 AI 才气的程序。咋测呢？便是让东谈主跟 AI 聊天，如果东谈主类分不清对面是 AI 照旧东谈主，那这 AI 就算赢了。

不外这图灵老爷子王人损失七十多年了，图灵测试似乎依旧是AI圈的一座“指路明灯”。

伸开剩余86%

在 2024 年，GPT-4 就挑战了图灵测试，并以 54% 的胜率得手拿下。

要知谈这图灵测试的合格线是30%，这收获一经算是妥妥的优秀了。

其时加州大学圣地亚哥分校的征询让 500 名参与者和四个 “对话者”（包括真东谈主、某古董机器东谈主 ELIZA、GPT-3.5 和 GPT-4）进行 5 分钟疏导，后果近六成的东谈主被 GPT-4 的演技忽悠了，其他AI王人没迈过30%的坎儿。

前段时期，又有东谈主拿最新的 GPT4.5 去作念了测试。后果标明，它不仅通过了图灵测试，更绝的是，它被当成东谈主类的概率比真东谈主还高！好家伙，这下真有东谈主活得还不如东谈主机了。

是以，这样多年了，这玩意凭啥还在屹立不倒呢？

要知谈，在臆测机还在用打孔纸带存储的年代，图灵就漠视了这个测试。这是因为其时的东谈主们还搞不清东谈主类想维的本体，要征询机器若何想考，就更无从下手了。

是以图灵就想，咱们不纠结本体，获胜看它的证据不就行了？就像一个东西，看起来像番茄，吃起来像番茄，那它便是番茄啊！如果机器有贤慧，那它就应该证据得像东谈主。

不外谁能猜想，直到今天，科学家还没搞清东谈主类大脑的运作格式。。是以这玩意退不了休，也有它的原理原理。

但江江其实一直有一个疑问，这图灵测试真有那么神吗？跟你对个话就评释AI有想考才气，是不是有点儿太豪恣了。

我上网搜了一下，不少网友也怀着相通的观点：王人5202年了，图灵测试早就落伍了。

其实吧，这玩意儿自从漠视，在业内反对声就一直不少。

早在1980年，加州伯克利的一位涵养就漠视，图灵测试根本没用。他举的例子是，把一位英语母语的东谈主关在房间中，然后向屋里传递中语写成的问题，而屋里有一册英汉双语的谜底书。这样他只需要每次收到问题，去找谜底，抄下来，再把谜底递出去就行了，根本无谓想考问题。

这照实是图灵测试的一个大bug——它只看谜底，不需要看历程。

何况，它的bug还不啻一个。1966 年，MIT 有个涵养整了个聊天机器东谈主 ELIZA，它能用通俗又无极的回话，让你以为它约略懂你。底下这段对话，乍一看没啥问题，仔细一商酌，ELIZA 便是个纯纯复读机！但还真能骗过一部分东谈主类。。

2014年，一位要领员文书，他的要领得手通过了图灵测试。但他的想法让东谈主直呼神东谈主，他让该要领伪装成一个13岁乌克兰男孩儿，而发问者是英语母语者，这就导致发问者以为，对方是小屁孩何况语言欠亨，顺口开河很平淡。

很领悟，这些机器东谈主把重点放在了“愚弄东谈主类”，而不是“想考谜底”上，测试的东谈主直呼被耍了。

这事儿也让好多东谈主开动对图灵测试火力全开。

2014年知名科技杂志IEEE Spectrum的一篇著述就漠视，图灵测试真不行，威诺格拉德测试才是当年！

这威诺格拉德测试呢，便是给机器出点知识性填空题，比如：

狮子吃斑马是因为“它们”是捕食者，这里的 “它们” 指的是 “斑马” 照旧 “狮子” 呢？

这题东谈主一眼就能答出来， AI 就得犯难了。

2020年，亚马逊的首席科学家 Rohid 也发文称，图灵测试早该淘汰了！

纽约大学涵养加里·马库斯致使直言：这玩意早落伍了，我但愿东谈主们健忘它，但东谈主们忘不掉它。

这样看，大伙对图灵测试积怨已久啊。

但其实，也不成怪大伙。就连图灵本东谈主，也莫得对图灵测试进行严格界说。这就导致，图灵测试像个框，什么王人能往里装。

就拿GPT4.5这篇著述来说，推行数据是1023场对话，平均长度8条音讯，抓续4.2分钟。这样短的对话，让许多东谈主获胜开喷，这也算聊天儿？

虽说图灵在 1950 年的著述里提到过，开动对话 5 分钟后，东谈主类认出 AI 的几率不卓绝 70% 就算通过。但那亦然基于其时的时期水平猜的一个程序，当今 AI 发展得这样猛，还这样低的程序，照实有点儿跟不上趟了。

再说了，当今的大模子言语贼像东谈主，一般东谈主根分内辨不出来。但它简直会想考吗？别看它整天整些 “深度想考” 的架势，本体上，它根本不睬解我方输出的东西，更别说样貌了。

就连不同的东谈主，对不同的AI的永别才气也不相通。就像打了一百遍的Boss，远不如初见杀的时候有杀伤力。资深AI用户去插足图灵测试，认出AI的概率细则更高，那么问题来了，要给AI搞个难度分级，通盘从东谈主类小兵干到最终东谈主类Boss，才算通关吗？

这样看，图灵测试这玩意bug还真挺多，照实没啥劝服力了。

但敦朴说，东谈主们当今纠结图灵测试过不外时，可能并不是图灵老爷子想看到的事儿。

就像老爷子在他的经典论文《Computing Machinery and Intelligence》里写谈：“咱们但愿机器能在总共才气界限与东谈主类竞争，但最佳的首先在何处？我也不知谈。”说到底，他也仅仅在一个界限，漠视了一种可行的解法结果。被其后的东谈主奉为圭臬，亦然他根本没猜想的事情。

而当今，ChatGPT能写出比大大王人东谈主还好的著述，Claude能熏陶你的电脑开动干活，咱们却还在哄笑AI通不外图灵测试，是否有点一叶障目了？

图灵从来莫得说过，通过了我的测试，AI才算得手。他信得过想看见的，仅仅东谈主类的无穷朝上结果。

撰文：不咕

裁剪：江江

好意思编：焕妍

图片、良友起首：

arXiv、Wiki、X、知乎、百度百科体育游戏app平台

发布于：浙江省

上一篇：欧洲杯体育现任财长珍妮特·耶伦对关税碎裂经济结构的指认-开云「中国内陆」官方网站更高效、更智能、更环保

下一篇：体育游戏app平台网友纷纷叹惜其鱼贯而来-开云「中国内陆」官方网站更高效、更智能、更环保