客户端
游戏
无障碍

0

评论

收藏

分享

手机看

微信扫一扫,随时随地看

当 AI 遭遇 “语言关”:从机器翻译到深度理解 | 社会科学报

图片

在确保享受技术革命带来的便利的同时,我们还应清晰地认识到生成式人工智能的本质和局限性,避免将其神化。我们既要以开放心态拥抱技术革命,又要保持"战战兢兢"的哲学审慎,确保其在促进社会进步的同时,不被误用或过度依赖。

图片


原文 :《以审慎而开放心态拥抱技术革命》

作者 | 陕西师范大学国际商学院    姚宇/教授    吴恒/研究生

图片 | 网络


维特根斯坦曾说:语言的边界就是思想的边界。语言问题尽管很长时间不为人工智能的主要研究群体所重视,但对它的研究一旦实现突破,所带来的就是人工智能的革命。语言究竟是什么?从表面上看,语言是用来表达思想、传递信息的工具,它以声音或文字的符号形式存在,并遵循一定的规则。然而,语言的本质远不止这些。语言是认知和思维的载体。它承载和记录着人类的知识、经验和情感,并在不同的文化和社会环境中体现出不同的面貌。分析哲学将语言划分为严格符号逻辑的人工语言与充满模糊性的日常语言,这种二元分野在人工智能领域则对应着形式语言与自然语言的区分。计算机的出现为这两组原本只能由专业人士跨越,而对普通人近似并行的体系搭建起了便捷的互通桥梁——从机器代码的精确指令到人类语言的丰富表达。计算机、互联网和人工智能等科学技术的发展也由此不断重构着不同语言形态的边界。 

“语言是存在之家”

图片

语言不仅是交流的媒介,更是我们理解世界和改造世界的认知基础。海德格尔认为:语言是存在之家。认知科学实验印证了这一点:人类大脑的布罗卡区与韦尼克区构成生物神经网络,通过递归结构将离散符号转化为连续思维流。当我们提到“苹果”时,大脑皮层激活的不仅是其视觉图像,还包括触觉记忆、味觉体验,甚至是牛顿定律的隐喻。这种符号与意义之间的自由映射能力,正是人类智能独特的核心特征。那么语言与智能之间又有着怎样的联系?智能的核心,正在于它能够生成、理解和运用复杂的符号系统。人类的认知能力在很大程度上正依赖于我们如何形成语言概念,并运用这些概念来记录经验、构建知识和解决问题。而人工智能的进步,尤其是在自然语言处理(NLP)领域的进步,正是在模拟和理解语言的形成与运用过程中,逐步突破了机器认知的局限,最终推动我们迈入了生成式人工智能时代。


人类建造巴别塔的传说,隐喻着语言隔阂对文明交流的阻碍。而机器翻译(MT)的技术演进史,本质上也是人工智能突破语言认知壁垒的探索史。这一领域的开拓可以追溯至上世纪50年代,其初衷是借助计算机技术架设跨语言沟通的桥梁,助力人类突破语言藩篱,促进不同文化间的交流与合作。然而,机器翻译由于难以根本解决自然语言向计算机人工语言转换的难题,仍然面临着诸如上下文理解不足、翻译质量参差不齐等问题。


转机出现在2014年,谷歌发布基于深度学习的神经机器翻译(NMT)。神经机器翻译的突破让机器开始理解语言背后的“思维轨迹”。当谷歌翻译准确译出“三个臭皮匠,顶个诸葛亮”时,意味着机器开始捕捉语言背后的概念体系,拥有跨越字面意义的理解能力,标志着机器首次触及语言认知的核心层。神经网络翻译技术的进步,使得机器翻译的准确度和流畅度大幅提升,逐渐接近甚至超越了人工翻译的水平。从机器翻译演进历程来看,它的意义远不止于提供跨语言沟通的便利,它是自然语言与人工语言交互的起点,是人类赋予机器理解与生成语言能力的伟大尝试。从最初的符号系统到今日的神经网络,机器翻译不仅是技术革新的历程,更是一场关于语言与智能的深刻探索。它将自然语言转化为机器可理解的符号体系,开启了人机交互的新纪元。这一技术的突破也为大语言模型的出现提供了基础。


图片


大语言模型的诞生,标志着计算机开始理解语言的“弦外之音”。大语言模型(LLM)是指通过海量数据训练而成的语言处理系统,能够自动理解并生成自然语言。当模型参数突破千亿量级时,语言处理开始呈现部分通用智能特征,包括跨领域迁移学习、零样本推理、元认知调节等。这些能力为生成式人工智能奠定了“认知”基础。

“人工智能的斯普特尼克时刻”

图片

生成式人工智能,顾名思义,就是能够基于给定的输入生成文本、代码、图像、音频以及视频等内容,这里的输入经常特指自然语言输入且不受领域限制。生成式人工智能作为大语言模型的延伸,将人机交互从机器翻译的“工具执行”升级为模拟认知的“思维共振”。它所实现的功能不再是不同语言之间的翻译,而成为可以服务人类大部分生产生活领域、具有卓越理解认知能力的智能助手;它通过数十太字节(TB)级以上文本规模的学习实现对语言的深度理解和生成,能够在各种领域与人类进行自然流畅的对话;它实现了普通大众对自然语言与计算机形式语言交流障碍的跨越;生成式人工智能的热潮就此袭来。2022年11月,OpenAI推出ChatGPT 3.5,其用户仅5天破百万,两年后活跃用户达2亿,成为历史上增长速度最快的应用之一。ChatGPT问世也意味着生成式人工智能从实验室走向大众。它的成功“出圈”也引发了全球科技巨头的竞相布局。在全球AI竞争日益激烈的背景下,中国的AI产业也在加速追赶,文心一言、通义千问、豆包、Kimi等生成式人工智能都有不俗表现。2025年1月20日,我国人工智能企业DeepSeek发布了开源模型DeepSeek—R1,该公司以560万美元低成本训练出的DeepSeek-V3模型,性能比肩ChatGPT-4o。DeepSeek的横空出世引起全球轰动,打破了国际社会对AI研发“高投入、长周期”的固有认知,被西方媒体称为“人工智能的斯普特尼克时刻”。仅10天时间,DeepSeek同时在中美两国苹果应用商店登顶免费App下载排行榜,微软、亚马逊、英伟达等全球科技巨头迅速接入DeepSeek模型,向开发者开放测试试验,国内政务、能源、通信、医疗等多个领域及央企、互联网大厂也纷纷上线部署DeepSeek模型。全球人工智能产业生态加速构建,在短时间内,生成式人工智能已全面进入大众生活。

“AI幻觉”:推理的“黑箱”

图片

生成式人工智能既是以往人工智能发展的延续,也具有其鲜明的特征。它既不同于第一代符号主义和知识驱动的人工智能(依赖于显式的符号系统和规则来模拟人类的推理过程),又不同于第二代连接主义和数据驱动的人工智能(基于神经网络和深度学习技术,侧重于从大规模数据中自动学习并捕捉隐藏在信息背后的模式和特征)。生成式人工智能是在前两代人工智能成果基础上的飞跃。它既吸收了第一代人工智能的符号推理和知识结构,又继承了第二代人工智能在海量数据学习和深层语境捕捉方面的优势,从而实现了对生产生活不同领域自然语言的高效理解与生成。


图片


生成式人工智能的革命性主要体现在两个方面。首先,它实现了自然语言人机交互的突破。生成式人工智能大大降低了大众使用人工智能的门槛。通过自然语言作为输入方式,它排除了传统系统对编程或专业技术的依赖,使得任何人都可以通过简单的语言描述,获得结构化的、经过逻辑整理的知识输出。这种转变不仅改变了人机交互的方式,还使得人工智能更具普遍性和易用性。其次,它实现了跨领域的应用。生成式人工智能通过对大规模数据的预训练和深层次语境理解,实现了在不同领域间知识的迁移和应用。从文本生成到代码编写,再到图像创作,它在各类不同场景下均展现出了卓越的适应性和创造力。


然而,生成式人工智能并非万能,它仍然存在显著的局限性。首先,尽管其在人机交互中表现出了高度的智能性,但它仍然只是人工智能众多领域中的一个分支,或者说它只是提供给我们一个在各种领域基于大数据概率归纳进行逻辑补全的智能工具,却无法替代其他领域的人工智能研发。例如在图像识别、实时决策和硬件交互等领域,传统的人工智能技术依然占据着主导地位。其次,生成式人工智能本质上依赖于大规模的数据和模型训练,在推理能力上仍存在显著的缺陷,它并不具备完整的溯因和演绎能力,也无法真正理解因果关系,而是一个推理“黑箱”,只能依靠概率性推测生成回答。例如由于“AI幻觉”的存在,模型可能会生成看似合理但实际上并不真实或无意义的输出。因此,它的生成能力往往受限于输入数据的“正确性”、质量和数量,既可能存在逻辑错误,又可能受到“欺骗”而形成“虚假”生成。


图片


总体来看,生成式人工智能的革命性体现在自然语言处理和人机交互中的突破,使得人工智能技术从单纯的运算工具发展成了一种可与大多数人便捷沟通协作的智能体。然而,生成式人工智能也并非无所不能,它仍存在着深层的算法和逻辑限制。理解生成式人工智能的有限性与发展历程,对于我们理性认识并利用这一技术至关重要。从机器翻译到大语言模型,从第一代符号主义人工智能到第二代连接主义人工智能,生成式人工智能一路走来的每一次跨越都值得我们深思。在确保我们享受技术革命带来的便利的同时,我们还应清晰地认识到生成式人工智能的本质和局限性,避免将其神化。随着技术的不断演进,人类对机器的认知与使用将更加深入与复杂,我们既以开放心态拥抱技术革命,又保持“战战兢兢”的哲学审慎,确保其在促进社会进步的同时,不被误用或过度依赖。





文章为社会科学报“思想工坊”融媒体原创出品,原载于社会科学报第1944期第3版,未经允许禁止转载,文中内容仅代表作者观点,不代表本报立场。


本期责编:潘  颜



《社会科学报》2025年征订



拓展阅读

免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部