189 8069 5689

关于智能聊天图灵测试的信息

未来的机器人能做人类的工作么?

包括ChatGPT在内的人工智能每一次演进,必然会导致社会中一些工作领域逐步被取代,这是不可避免的趋势。因为,一些重复性操作、简单性归纳和分析的任务,机械运算速度快且“不知疲倦”的机器当然比人做得更好。原先在“具有简单重复、数据初级处理和分析特征”的这些领域工作的人,确实会面临失业的风险。

为企业提供做网站、成都网站制作、网站优化、全网营销推广、竞价托管、品牌运营等营销获客服务。创新互联拥有网络营销运营团队,以丰富的互联网营销经验助力企业精准获客,真正落地解决中小企业营销获客难题,做到“让获客更简单”。自创立至今,成功用技术实力解决了企业“网站建设、网络品牌塑造、网络营销”三大难题,同时降低了营销成本,提高了有效客户转化率,获得了众多企业客户的高度认可!

但是,被取代的概率、程度和方式,则需要根据人工智能在可预见的时期内的“智能潜力”和“对人的取代维度”和“对人的不可替代维度”来判断。比如,ChatGPT能简单交互,可能就不需要接线员这类的岗位了,但更具拓扑思维特性的任务策划、战略安排之类的工作,它暂时搞不了。又如,ChatGPT能做文本翻译,但因为语言的翻译背后还对应着一个庞大的文化问题,所以应用性的翻译它拿得下,其余更具文化和心理属性的翻译事项则未必;再比如,高端一点的,它能综合数据库现有信息,写成一篇形态规范的研究报告或论文,但它依然取代不了研究工作,因为研究和写论文本质上是“创造知识”,但它只是在“整理和传播”知识,而非创造……

总的来看,人工智能目前再发达,也只是在机械、线性运算逻辑上的算力发达;而人的思维特征和无限能力,是建构在“线性+拓扑”的无限量子风暴演绎的基础上的。只要人工智能的算法框架没变(暂时也难),全面取代人力是不现实的。

更不要说,即便人工智能的很多应用即便通过“图灵测试”,伪装得像个人,它依然是对人“某些方面”的高级模拟。自主意识和人格,人文精神和思想,是一道天堑。

所以,人工智能来了,确实很多工种会被逐步取代。但是我们有应对的总体方向,那就是,通过终身学习,不断提高自己在人工智能“搞不了”或“搞不好”的地方的知识和技能。

chatpgt是什么

ChatGPT是OpenAI开发的大型预训练语言模型。这是GPT-3模型的一个变体,经过训练可以在对话中生成类似人类的文本响应。

ChatGPT背后的算法基于Transformer架构,这是一种使用自注意力机制处理输入数据的深度神经网络。Transformer架构广泛应用于语言翻译、文本摘要、问答等自然语言处理任务。ChatGPT可用于创建能与用户进行对话的聊天机器人。这对客户服务很有用,因为它提供了有用的信息或只是为了好玩。

ChatGPT使用方法和注意事项:

支持中文和英文,都可以问,它不是Siri这种机器人,他是一种生产力的工具,要把它当作真实的人来对话,可以让它改进,支持上下文多轮对话,放心大胆的问,每次回答的字数有应该有限制,可以使用“继续问”等来追问,它会继续写。

AI届已经进入新的范式,学会提问题会越来越重要

弱人工智能是指仅仅模拟人类大脑的( );强人工智能是指其本身就是一个( )。

弱人工智能是指仅仅模拟人类大脑的(  智能  );强人工智能是指其本身就是一个(  心智  )。

一,弱人工智能

也称限制领域人工智能或者应用型人工智能。

指的是专注于且只能解决特定领域问题的人工智能,毫无疑问,我们今天看到的所有人工智能算法和应用都属于弱人工智能的范畴,AlphaGo是弱人工智能的一个最好实例。AlphaGo虽然在围棋领域超越了人类最顶尖选手,但它的能力也仅止于围棋。一般而言,限于弱人工智能在功能上的局限性,人们更愿意将弱人工智能看成是人类的工具,而不会将弱人工智能视成威胁。

二,强人工智能

强人工智能又称通用人工智能或者完全人工智能,指的是可以胜任人类所有工作的人工智能,人可以做什么,强人工智能就可以做什么,这种定义过于宽泛,缺乏一个量化的标准来评估什么样的计算机程序才是强人工智能为此不同的研究者提出了许多不同的建议。最为流行,被广为接受的标准,是前面我们详细讨论过的图灵测试,但即便是图灵测试本身,也只是关注与计算机的行为和人类之间的行为。从观测者角度而言的不可区分性,并没有提及计算机到底需要具备哪种具体的特征或能力才能实现这种不可区分性。

图灵测试已经过时?现在有更高级的算法吗?

亚马逊Alexa副总裁兼首席科学家Rohit Prasad认为,旧的计算标准对当今的人工智能时代已不再具有借鉴意义。

今年是艾伦·图灵引入“图灵测试”概念的论文发表70周年。在这篇论文里,他回答了这个问题——“机器会思考吗?”。该测试的目标是确定机器能否表现出与人类难以分辨的对话行为。

图灵预测,到2000年,普通人在模拟游戏中将人工智能与真人区分开的概率将不到70%,游戏中的回应者可能是真人,也可能是人工智能,而评估者对此毫不知情。

阿兰·图灵

为什么20年过后,作为一个产业,我们还无法实现这个目标呢?我认为图灵提出的努力目标对我这样的人工智能科学家来说并不是一个实用目标。

图灵测试充满了限制性因素,图灵自己在这篇开创性论文中就讨论过其中一些。随着如今人工智能普遍集成到手机、汽车和家庭中,一个事实越来越明显:人们更关心他们与机器的交互是实用、无缝和透明的,实现机器与人真假难分的理念已经过时。

因此,是时候让这个70年来一直作为灵感源泉的传奇退役了,我们需要设立一个全新的挑战来赋予研究者和从业者以同样的灵感。

图灵测试与公众想象力

在概念引入后的短短几年里,图灵测试成为人工智能学术界的北极星。

六七十年代最早出现的聊天机器人“伊丽莎”(ELIZA)和“帕里”(PARRY)的目标就是通过图灵测试。2014年,聊天机器人“尤金·古斯特曼”(Eugene Goostman)宣布它通过了图灵测试,骗过了33%的人类裁判,让他们误以为自己是真人。然而,正如其他人所指出的,骗过30%人类裁判的标准是武断的,即使这样,这场胜利还是让一些人觉得过时了。

然而,图灵测试继续激发着公众想象力。OpenAI的“生成性预训练”Transformer 3(GPT-3)语言模型以其击败图灵测试的潜力而成为头条新闻。同样地,记者、商界领袖和其他观察家仍然会问我:“Alexa什么时候能通过图灵测试?”

毫无疑问,图灵测试是衡量Alexa智能的一种方法,但这样衡量Alexa的智能真的重要吗?有意义吗?

要回答这个问题,让我们回到图灵第一次提出这篇论文的时候。

1950年,第一台商用计算机尚未开售,光纤电缆的基础性研究又过了四年才发表,人工智能领域也还没有形成,要到1956年才正式确立。如今手机的计算能力是阿波罗11号的10万倍,再加上云计算和高带宽连接,人工智能可以在数秒内根据海量数据做出决策。

虽然图灵的最初设想仍能赋予我们灵感,但将图灵测试理解为人工智能进步的终极标志,必然会受到它刚提出时所处时代的局限。

首先,图灵测试几乎没有考虑人工智能的机器属性,比如快速计算和信息查找等,这些才是现代人工智能最有效的特征。

刻意强调骗过人类,意味着人工智能要通过图灵测试,就必须在回答诸如“你知道3434756的立方根是多少吗?”或者“西雅图离波士顿有多远?”这类问题的时候做出停顿。

事实上,人工智能立刻就知道这些答案,而做出停顿让自己的回答听起来更像真人,并不是利用其技能的最佳方式。

此外,图灵测试没有考虑到人工智能使用传感器听、看和感受外部世界的能力越来越强大。相反,图灵测试仅限于文字沟通。

其次,要想让人工智能在今天更实用,这些系统需要高效地完成我们的日常任务。当你让人工智能助手帮你关掉车库的灯时,你并不想发起一场对话。相反,你会希望它立刻满足这个要求,并以一个简单确认比如“ok”或“好的”来通知你。

即使你与人工智能助手就一个热门话题进行广泛对话,或让它为孩子朗读故事,你还是想知道它是人工智能而非真人。事实上,通过假装真人来“骗过”用户会带来真正的风险。想想反乌托邦的可能性,我们已开始看到散布假消息的机器人和深度虚假新闻的出现。

人工智能面临全新的重大挑战

与其说沉迷于让人工智能与人类毫无差别,我们更应该致力于构建能增强人类智力、以公平和包容的方式改善我们日常生活的人工智能。

一个有价值的潜在目标是,让人工智能表现出类似人类的智能属性——包括常识、自我监督和语言能力,与快速搜索、记忆唤起和代表你完成任务等机器效率相结合。最终的结果是学习和完成各种任务,适应全新的情况,远超一个普通人所能做的。

这一焦点揭示了当前人工智能领域真正重要的研究——感官理解,对话,渊博的知识,高效学习,决策推理,以及消除任何不恰当偏见(即实现公平)。这些领域的进展可以用多种方式来衡量。

一种方法是将挑战分解为多个任务。例如,Kaggle的“抽象和推理挑战”专注于解决人工智能从未见过的推理任务。

另一种方法是为人机交互设计一个大规模的现实世界挑战,比如“Alexa 社交机器人大奖赛”——一个面向大学生的对话型人工智能大赛。

事实上,当我们2016年推出Alexa大奖赛时,我们就应该如何评价竞争对手的“社交机器人”展开了激烈的辩论。我们是想让人们相信社交机器人是真人,展开某种程度的图灵测试吗?或者,我们是想让人工智能具备进行自然对话的能力,从而促进学习、提供娱乐,还是只是把它当作一种令人愉悦的消遣?

首个获得公民身份的机器人“索菲亚”

我们制定了一个规则,要求社交机器人在20分钟内与真人就包括娱乐、体育、政治和科技在内的广泛热门话题进行连贯有趣的对话。

在决赛前的开发阶段,客户会根据是否愿意与机器人再次交谈来给它打分。在决赛中,独立的人类裁判会根据连贯性和自然性以5分制为其打分。

如果任何一个社交机器人的平均对话时长达到20分钟,并获得4.0以上的分数,那它就能通过这个重大挑战。

虽然目前还没有社交机器人通过这一重大挑战,但这种方法正引导人工智能研发,使其在基于深度学习的神经方法的帮助下,拥有类似于人的对话能力。它优先考虑让人工智能在适当情况下展现出幽默和同理心,而无需假装成真人。


本文名称:关于智能聊天图灵测试的信息
转载来源:http://cdxtjz.cn/article/ddgedep.html

其他资讯