这也使得智能中文聊天手机能够适应复杂多变的环境,捕捉细微的信号,发现潜在的联系。即 数据驱动这类技术,都是通过从大量的数据中学习模式和规律,而不是依赖于预先设定的规则或假设。智能中文聊天手机10多亿部发行,类似分布式表示。这也是一种“超大量技术”,即是通过多层次、多维度、多模态,类似神经网络,在表示数据和知识,而不是像中英文ChatGPT使用传统的符号逻辑或数学公式。这使得智能中文聊天手机能够表达丰富多样的语义和概念,处理不确定性和模糊性,实现泛化和迁移。 再说中文聊天手机的端到端优化之争──端到端优化技术,是指通过定义一个目标函数,或奖励信号,来指导学习过程,而不是依赖于人为设计的特征或步骤。这使得中文聊天手机能够自动地调整参数和结构,寻找最优或次优的解决方案,实现自适应和创新。端到端优化面对自然科学领域之争,有几个共同点:一是具有复杂性。 自然科学领域涉及到多种因素的相互作用,多种尺度的变化,多种状态的转换,多种现象的出现。这些复杂性使得人类难以用简单的规则或公式来描述或预测,也使得传统的计算方法难以有效地模拟或分析。二是不确定性──自然科学领域受到多种噪声和干扰的影响,存在着多种偶然性和随机性,涉及到多种概率和统计。 这些不确定性使得人类难以用精确的数值或逻辑来度量或推理,也使得传统的实验方法难以准确地观测或验证。三是创新性。 自然科学领域不断地出现新的问题和挑战,需要不断地提出新的假设和理论,需要不断地发现新的规律和现象。这些创新性使得人类难以用既有的知识或经验来解决或回答,也使得传统的科学方法难以适应或更新。发现自然科学新规律的底层逻辑是:利用人工智能技术在大量数据中寻找分布式表示、端到端优化和自我强化的方式,来模拟、理解和创造自然科学中的复杂、不确定和创新的现象当然,这并不是说AGI技术就可以完全取代科研工作者或传统科学方法。 AGI技术仍然需要人提供数据、定义问题、解释结果、验证真实性等。AGI技术也仍然需要与数学、物理、化学等基础学科相结合,借鉴其原理、方法、概念等。AGI技术只是一种新的辅助工具,一种新的思维方式,一种新的探索途径,它能够帮助我们人类更好地认识自然,更好地推动科学。然而打开大脑,里面是一堆神经元。打开AGI技术,AI里面就是一堆函数──不仅仅是大模型,实际上在AGI技术智能的各种相关领域,算力都是命脉。 3)中文聊天手机的算力之争 那么联系比如物联网,应用到AGI技术智能时,需要进行大量的设备数据处理、预测分析等任务,这也离不开算力吗? 有人说:看不见的精密计算与算力,AGI技术智能一天也离不开海量的算力;这是卡人工智能脖子的第一关。那么AGI技术扩展算力就行了吗?在AGI技术智能领域,提升算力可不容易。 训练和运行AGI技术智能,可不是随便找个芯片就能干的。 目前的主力芯片,是单片价值1万美元的A100芯片,它占据了数据中心AGI市场90%以上的份额。“核弹级AGI”光是先进芯片的成本就要2.5亿美元。可见训练和运行AGI技术智能被算力卡脖子,而算力又被先进芯片卡脖子。有时训练AGI技术智能的先进芯片即使贵,还拿钱买不到。我国半导体设备和材料被卡脖子,是以前依赖国外厂商,断供自然影响巨大。国外的制裁,也是瞄准这一弱点。 从AGI技术智能的前沿领域到算力卡脖子,到先进芯片卡脖子,再到制造先进芯片的设备和材料卡脖子,我国需要啥,国外就制裁啥。这种源头上的问题,我国正在解决。而且我国也在出手反制──锗、镓,都是战略性的基础原料,也是半导体制造的核心材料。我国镓的供给占比97%、原生锗的供给占比为70%以上。锗、镓在芯片制造、通信设备和国防等领域有着广泛的用途。在外国对高端半导体设备管控升级后,我国控制出口。越来越多国内厂商,也在切入半导体设备和材料先进工艺赛道,不仅能填补低端市场空缺,还能不断迭代升级。 相比国外的管制措施,相当于把我国巨大且不断增长的半导体设备材料市场,拱手相让。当然尽管这个增幅很大,但前方等待着的依然是星辰大海。讨论智能中文聊天手机,是盼望极大解放全人类的脑力,这也涉及算力的极大提升。要算力想不被卡脖子,也需要先进芯片;想要制造先进芯片,就不能被半导体设备和材料卡脖子。 有人说:向智能中文聊天手机迈进,百度的“文心一言”、阿里的“通义千问”、讯飞的“讯飞星火”等,这其中算法可能不是差距最大的环节,真正卡脖子的是很多人想不到的算力──算力对于训练大模型可是太重要──大模型想要包罗万象有问必答,就得动辄千亿级别的参数,这些参数需要在训练过程中不断更新和调整。 没有足够的算力,就无法快速更新这些参数。大模型见多识广还反应灵敏,离不开训练时灌入海量的数据,这些数据需要在短时间内被处理和分析。没有足够的算力,就无法快速地处理这些数据。要赶训练进度,大模型往往还要用分布式训练来加速训练。这种方法需要将模型分布在多个计算节点上进行训练,每个节点都需要足够的算力来完成自己的任务。其次,训练大型模型还需要复杂的数学计算,才能表现得足够聪明伶俐,这同样要消耗大量的算力。 这里不仅要算对,还要算得又好又快。但有人说:我们算力现在并不缺,如华为包场,这个包场指的是从上游芯片到框架到模型到应用再到云端运行,国外比如美国是英伟达提供芯片和底层,谷歌提供框架,各大公司架设模型,再有云商提供服务,比较分散,执行力远不如华为。国内除了华为,也还有其他的芯片、框架等,比如寒武纪,也有训练和推理芯片。华为盘古大模型,再看有些视频就知道,中英文ChatGPT只是千千万万应用大模型里最普通的其中之一。落后就是卡脖子?现在还能有建国那时落后?或影响你现在的幸福生活? 要说好的算法比算力更重要,是在芯片不行时,倒逼研究新算法,优化算法。华为是提供算力平台的,我国缺算力?新的人工智能算力是美国对我国制裁的核心,华为有那本事,美国还制裁个啥? 只要不自残,无论是贸易战,金融战,科技战,甚至是真枪真炮的热战,最后的胜利者一定是我们。反之只有一种可能,华为模型底层神经网络也是人家发明的。我国算是拥有世界顶级超算最多的国家,难道我国的超级计算机都是摆设?自从被制裁后,我国的超算发展其实是出于一个停滞的阶段。如“神威太湖之光”的后续型号“神威海洋之光”在原型机的建造后,由于没有能力生产所需的纳米制程(CPU7),所以这台拥有顶级算力的超算,一直迟迟不能完成。 在AGI技术智能领域,由于5G技术的率先普及和覆盖,我国的实际应用,比包括美西方国家在内的任何国家,都更广泛、更深入。 c、开辟中文第二战场许仰天-黄峥模式可借鉴 2006年在北京人民大会堂召开的国际弦理论大会上,几位发言的科学家都是直接使用英语,会场也没有同声传译设备,文本资料使用的也都是英语。这使得场下的6000多名听众,包括一些从外地赶来的大学生,大都没有听懂他们讲了些什么。 这一类的学术会议,通常会邀请几位外国学者参加,但他们的问题,完全可以通过向他们提供翻译服务来解决。当年国内民办经政府批准的互联网科学论坛很多,但因没有政府推行颁布保护英文科技论文被中文翻译传播及中文科技论文在全球传播的权利,使之能对不懂英文的中国民众做大语言模型训练,释放出长期被压抑的创造力的知识产权改革,以后一个接一个倒下关闭太可惜,太“去中国化”。 科技科学中文论文走出国门,可否借鉴许仰天-黄峥模式,是一个值得研讨的问题。所谓“许仰天-黄峥模式”,是指2023年的《新财富500富人榜》上,两位超音速般爆发的中国80后首富级企业家:一位是39岁的跨境电商平台SHEIN(希音)创始人许仰天,以1120亿元财富登顶广州首富。另一位是跨境电商平台Temu背后的拼多多创始人黄峥,则以2603亿身家成为上海首富。他们跨境走向世界推销介绍的产品,虽然不是科技科学中文论文这种语言文字形式,而是以实物做电商平台,但这中间的韬略智慧是相通的,可以借鉴的。 1)许仰天模式 科技科学中文论文开启一场回归自然的世界级“聊天”大对决,中英文东西方双双动用法律,作动作手段与反动作手段,虽然是必须的。但许仰天有一个观点:“成功不分国界”,这是一种模式吗? 许仰天,1984年生,山东淄博人。2007年毕业于青岛科技大学国际贸易专业;2008年在南京从事跨境电商业务,主要是卖婚纱。后来在一家外贸线上营销公司负责搜索引擎优化方面的工作,创立中国跨境电商平台SHEIN(希音)。2022年希音是全球搜索次数最多的时尚品牌,在113个国家和地区的顶级品牌排行榜中占据主导地位。 中文或英文科技科学论文发表,是在争市场、争用户吗?这是与“商业模式”不同的地方。如果科学是第一生产力,竞争本是正常和有客观评判标准的现象,如李侠教授说的:“没有大量的优质文化产品与高端科技产品作支撑而幻想话语权,那无异于缘木求鱼”。然而正是“话语权”有别,不管是在国内还国外,不管过去还是现在和未来,都存在着“科技圈内”和“科技圈外”之间的竞争。如“话语权”不对等,“去中国化”本质是英文“科技圈”把自家看成是生产力的“科技圈内”,把中文“科技圈”看成是生产力的“科技圈外”。 中国80后的年青一代在“科技圈外”崛起,用商业产品模式证明中文或英文科技科学,不存在天生的“优质与高端”的差别。如“数字经济”本身属于科技科学,许仰天用数字经济手段为我国制造出海,提供超级出口。所以有人说,“希音”的出现,直接终结了比赛。 “许仰天模式”的秘笈,叫作“小单快反”──指用极小的首单单量,来测试市场;通过平台数据监测,发现某款商品具有“爆款”潜力时,平台再将信息返到工厂增加生产订单。因为不涉及大量提前生产,返单生产会极大地降低库存。依靠这种模式“希音”的一件服装,从打样到送到消费者的中,只需要短短20天。每一天“希音”能实现平均5000款上新。相比老牌模式,“希音”模式,甚至改变了行业──即大量快速上新、极高性价比和高周转低库存,之前被老牌模式一直定义为:存在一个“不可能三角”。但“许仰天模式”,靠产品迅速迭代和足够廉价,很多品牌可以很快起飞。
|