正如林毅夫院长自己所说:“使用自然语言不利于知识在不同时代、不同国家之间的传播,使用数学语言则可以克服这些问题,更利于知识的传播。科学革命对工业革命有两方面的贡献:一是方法论上的贡献,以可控制实验作为试错的方法和手段:二是推动技术分布曲线右移。利用可控制实验发明新技术在遭遇到瓶颈时,可以通过基础研究增进人们对自然界的了解,从而使技术分布曲线向右移动”。 1840年鸦 片战争后开始的洋务运动,许多先进的中国人已经懂得上面林毅夫院长说的道理。汉语从改革文言文,到使用白话文,到今天汉语拼音嵌入英文字母符号,把中文和英文的长处,都集合起来,应该比单打独斗的英文强,为什么?上面记者齐倩报道梁文峰总裁领导的“DeepSeek震撼世界”,就是一个例子。这又为啥? 1、陈经不是王选 2025年2月5日观察者网发表的文章《Deepseek大模型推理算法其实很简单|陈经》,从大模型最直观的输入输出行为用数学原理语言,作的中文和英文的结合与不结合类似一场人工智能革命解释;我们认真研究发现,陈经教授揭示的Deepseek大模型推理算法,其实类似是和 OpenAI 开发的ChatGPT,作人工智能聊天机器人的英语全球竞赛。为啥?只要反问Deepseek的中文名字应是啥? 也许陈经教授是喝过“舍得酒”,变成“得舍”人──有得有舍。 观察者网跟帖文章中,有简称DeepSeek为“DS”的。我们读陈经教授的文章,根据他的大模型推理算法,其实Deepseek推理算法并不简单。但陈经教授的数学方法教会我们,Deepseek的中文名字应叫“得舍”软件、平台,或者叫“得舍”ChatGPT,而不是中文人工智能聊天机器人,更不是中文智能聊天机器人手机。 因为陈经教授不是王选院士──即使后者和他的学生与战友,也没有像研制出第四代激光汉字照排系统一样,也研制出中文人工智能聊天机器人或中文智能聊天机器人手机,但王选院士的激光照排技术揭示汉字字库的算法,还有结合物理的方法,才能解决其中的复杂问题,所以至今还在奋斗。至于陈经教授说的“得舍”“Deepseek大模型推理算法其实很简单”也能理解,就是大模型经过一段时间中文智慧革新的搜索、思考,有输出英文反馈更强的新特性;不信“联网搜索”试试。这就是为啥美国总统特朗普2025年2月7日,在白宫会见日本首相石破茂时,向记者们说:DeepSeek不会对国家安全构成威胁,美国最终可以从DeepSeek的人工智能创新中“受益”。 可以说王选院士的激光照排技术,揭示汉字字库的算法,巩固的是中文人工智能的后方。梁文峰总裁的“得舍”(Deepseek)大模型最根本功能的统计和输出概率,冲锋的是ChatGPT(人工智能英文聊天机器人)的前方;这是陈经教授的数学原理方法,没有说到的。 这也是马斯克这位世界最有钱的大忙人,自从特朗普在今年初当上美国总统,他作为美国政府效率部负责人,即使带领六个20岁左右的年轻人利用先进的AI科技手段,能对联邦政府的国防、教育、财政支出等部门展开审查和调查。但他在2025年2月9日的直播聊天中,马斯克特别还谈到“得舍”(Deepseek)类似是在支持他的人工智能“革命”。马斯克透露“得舍”(Deepseek)的能力令他印象深刻,比XAI(马斯克AI企业)和其他公司的ChatGPT更强大。 由于中国的“得舍”(Deepseek)对美国AI科技界产生的巨大冲击力,美国政界和科技界也意识到中美在AI领域的白热化竞争已经开始;之前美国AI大模型之所以要选择闭源,就是想要通过这样的方式遏制中国在AI大模型上的进步。但美国没有想到,中国竟然用中文“得舍”创新思维选择完全不一样的技术路线,发展出一个领先的大模型,并且还选择全面开源,迅速席卷了全世界各个国家,仅仅用了7天时间就突破了1亿用户。现在他们必须拿出更加先进的大模型,否则中国的“得舍”就会因为开源,而快速抢占全球市场。 那陈经教授是个什么人?有说他是亚洲视觉科技研发总监。 陈经教授作为科技与战略风云学会的副会长,曾获中国科技大学计算机科学学士,香港科技大学计算机科学硕士,也是长文《中国的官办经济》的作者。“得舍”(Deepseek)大模型推理算法其实很简单的文章,也有落名“袁岚峰”的;袁岚峰教授,是中国科技大学知名的高能物理学家。袁岚峰,是否有时他和陈经是同一个人? 我们只看到袁岚峰说陈经是他的朋友、是一位人工智能专家。 2、“得舍”(Deepseek)中文命名陈经式考究 美国人工智能公司“AI梦工厂”OpenAI,在 2022年11月30日正式发布开发的ChatGPT,不仅是一款英文智能聊天机器人软件,是新一代聊天机器人的突破,也为信息产业带来巨大变革。 马斯克是其创办人之一;ChatGPT作为一款基于人工智能技术驱动的自然语言处理工具,不仅能学习和理解人类语言,进行对话和互动,帮助完成撰写邮件、视频脚本、文案、翻译、诊疗、编程等大量重复性任务,让撰写邮件、论文、脚本,制定商业提案,创作诗歌、故事,甚至敲代码、检查程序错误都变得易如反掌。 但在陈经教授看来,说它还能用人类语言和你聊得飞起,简直是智能世界的对话新篇章;但如果王选院士还在世,他会和90%只会说中文的人一样要摇头。因为ChatGPT也还不是王选式中文人工智能聊天机器人或中文智能聊天机器人手机。且不说ChatGPT由此带来的学术造假、技术滥用、舆论安全等风险,亦不容忽视。 然而陈经教授也看出,类似中文成语,有运用历史与现实映照的巧妙;这种把中文的“深度思考”也加进,如果从语言角度看“得舍”(Deepseek)思考过程,也有可展示给用户看的。例如,他说唐代诗人贾岛的唐诗中:“僧推月下门”还是“僧敲月下门”?贾岛琢磨,问是“僧推月下门”还是“僧敲月下门”?韩愈说:“敲”更好。 陈经教授说;这是文科思维;大模型是理科思维,会说“推”的概率15%,“敲”的概率20%,还有“叩、拍、打、撞、触、启、扣、抚、击、砸、碰、踢”,都各有概率,都说得通。因为看待问题的角度独特,大模型能把文科本事学得非常好,我们要习惯大模型的统计概率视角。实际他说的是人工智能大模型的推理算法,就是一种“推敲”;ChatGPT是这样,“得舍”(Deepseek)也是这样。但为啥“得舍”又能强过英文聊天机器人?这就类似中文智能聊天机器人手机即使不上网、联网,除有“推敲”推理算法外,还有中国人常说的“有舍有得”、“有得有舍”的“得舍”推理算法,真奥妙。 陈经教授的文章《Deepseek大模型推理算法其实很简单》,把它解释为的随机性、“温度”参数控制、“令牌”和“词元”比较、“英文大模型”、“中文大模型”、训练素材、“词汇表”、程序代码行数、出圈、开源社区、闭源、追平、“管线”、数据蒸馏、“自回归”生成文本,“多模态”图片、录像、语音输入,特殊标记、概率组合,统计和输出概率、分词算法、“嵌入”、“数学模型”、“向量”、浮点、格子示意、矩阵处理、维度、“词元嵌入矩阵”、“中间矩阵”、矩阵知识、权重、工程源码、张量运算库、编译、代码关键信息、矩阵分层计算、原始结构图、编码器、解码器、一国文本、另一国文本、架构、循环神经网络、“注意力机制”、自注意力、“查询”、方阵、自行搜索、掩码操作、掩码矩阵、“残差连接”、“梯度”、“注意力头”、前馈神经网络、联网搜索、“深度思考”、搜索引擎、拼接、思维链、监督微调等等表达标识,用的都是英文──英文伟大……垄断“还是英伟达”。 虽然陈经教授说:“中国开发团队也是英文和外文的都收集,可能会精心准备更多中文素材,但不会占主要部分。而且,大模型的输出是中文、英文、其它外文都会的,并没有特别区分。它是看用户提示词用哪种语言,就会输出对应的语言,天生就是通万国语言的”。
|