将一切用大语言模型作数学来处理

王德奎 · 发表于: 2023-11-16 19:47:45

将一切用大语言模型作数学来处理

林清陶

摘要：人工智能（AI），本身是一种应用技术，像智能手机普及一样，是一种时代进步的要求和趋势。而基础科学前沿理论研究，本身也并不全在于探索未知世界，其中更多的还是要为人类社会的发展和进步服务，提供有实用价值的应用技术，所以两者发展到一定时候是结合的。如何结合呢？就是反过来将一切用大语言模型作数学来处理。这也是新形势下的一种基础科学前沿理论研究，是双赢共享的。这是百年大变局的另一个里程碑时代的到来。

关键词：人工智能、大语言模型、数学几何、处理、通用

【0、引言】

在人工智能（AI）大语言模型聊天机器人（ChatGPT）出现后的非常火热的当下，21世纪以来基础科学前沿理论研究，如超弦理论、圈量子理论、大爆炸宇宙论、黎曼猜想、质子化学组学等，对比显得停滞不前的状况就更加引人注目。其实，这是一件可以双赢的好事。

因为人工智能（AI）虽然本身是一种应用技术，但像智能手机普及一样是一种时代进步的要求和趋势。而基础科学前沿理论研究本身也并不全在于探索未知世界，其中更多的还是要为人类社会的发展和进步服务，提供有实用价值的应用技术，所以两者发展到一定时候是结合的。如何结合呢？就是反过来将一切用大语言模型作数学来处理。这也是新形势下的一种基础科学前沿理论研究，是双赢共享的。

这是百年大变局的另一个里程碑时代的到来；此想法来自《环球科学》杂志2023年11月号，发表的《用AI与动物对话》一文中说：“自然语言处理模型开始能够‘将一切都当作某种语言来处理’” ──这是“一种可以根据语言描述生成逼真图像的人工智能系统，即它能够以极高的准确度，将代表文本的形状映射为代表图像”的技术。

当然，《环球科学》2023年6月号，发表的《大语言模型如何学数学？》一文中也说：“近来大火的大语言模型似乎已经表现出与人类相近的智能水平，但它们存在‘致命’的缺陷：无法自我纠错。这导致它们经常会出现前后文细节不一致的情况。为此，有两项新工作正尝试教大语言模型翻译并求解数学问题。他们希望通过训练大语言模型的数学思维，将强化学习模型能根据环境反馈改进自己的优点结合起来，从而提升大语言模型自我纠错和逻辑推理的能力”。

大语言模型带来了人工智能和自然语言处理的革命──大语言模型作为具有广泛应用的变革工具而受到重视：这些模型利用机器学习和自然语言处理的力量来理解和生成与人类表达非常相似的文本，让我们深入研究这些模型如何彻底改变涉及文本和交互的各种任务；大语言模型带来了文本生成和完成的新时代。

然而在2023年11月9日举行的世界互联网大会乌镇峰会互联网企业家论坛上，百度创始人、董事长兼首席执行官李彦宏教授在发言中，谈AI时提到“只有拥有数以百万计的AI应用，大模型才算得上成功”──他说：目前在开发大模型中存在误区，首先专用的大模型没有智能涌现的能力，“我和一些行业企业家交流，他们还在买卡，屯芯片，想从头开始修炼大模型，我认为这个方向走错了。要开发好用可用的大模型，存在很高的技术壁垒和高昂的成本，重复开发会给社会资源造成极大的浪费”。李彦宏董事长认为：技术创新的最终目的是应用，人类进入AI时代的标志是出现大量的AI原生应用，而不是出现大量的大模型；大模型可以支撑无数的AI原生应用开发，但只有拥有数以百万计的AI应用，大模型才可以算得上成功。

他说：“大模型和算力本身并不产生价值，利用大模型等技术构建繁荣的AI原生生态才是关键，才能成为推动经济增长的直接动力。而大模型智能涌现是开发AI原生应用的关键，AI的原生应用就是基于大模型的智能涌现而生成逻辑记忆能力开发出来的，所谓智能涌现就是教它之前不知道的东西，解决之前没有解决的问题”。

其实，即使21世纪以来基础科学前沿理论研究的状况停滞不前，在21世纪之前和之后以来，积累的无数科研成果和观察、实验资料，本身已是构建的繁荣AI原生生态，和涌现开发的AI原生应用。它们和人类一切一切相处的自然及社会现象、事件一样，组成是远远超过李彦宏教授所说的“拥有数以百万计的”AI原生生态和涌现开发的AI原生应用。因此，李彦宏教授说的背后，其实是如何来看待数学？

我们说：“将一切用大语言模型作数学来处理”，是面对今天人类社会科技发展到机械化、自动化，出现电子计算机和量子计算机的新时代，数学计算从加、减、乘、除、开平方、求对数、三角函数、导数、微积分、概率统计，到矢量、张量、泛函、几何、拓扑等方法，看似很传统，其实这也是一种大语言模型数学计算的原生生态表现，它们是前进发展，可综合、可扩散、可简单与复杂相结合的。

例如，美国杰出物理学大师费曼，对量子计算发明的费曼图路径积分公式就很奇特有效，为计算量子系统的行为提供了一种直观且有效的方法，而费曼图则成为解释基本粒子相互作用的重要工具。

而AI模型--机器学习模型“将一切用大语言模型作数学来处理”，正类似费曼图路径积分方法的创新和历史的综合。下面是，如何来实践“将一切用大语言模型作数学来处理”的几个通用人工智能（AGI）--通用大语言模型（PaLM2）的应用例子。

【2、用大语言模型数学研判读懂鸟语兽声】

“将一切用大语言模型作数学来处理”在研判读懂鸟语兽声方面的应用，是基于随着传感器价格降低，水听器、生物记录器和无人机等技术取得进步，动物数据出现了激增。但暴增的数据量也让生物学家无法有效地通过人力筛选出有用信息。而人工智能却能通过大量数据取得惊人的进展。像聊天机器人（ChatGPT）这样的大语言模型，必须经过大量文本训练，以学会如何针对提示词生成相应的回应。

这类似在人类语言之间互译的方法，关键在于机器学习模型可以将词语之间的语义关系转化为几何关系。现在的机器学习模型能够通过对齐不同语言的几何形状，从而在未知的人类语言之间进行翻译。

即在一个语言空间中，各个词语之间具有一定的几何关系。因此可以利用两个词语，比如“母亲”和“女儿”在彼此附近出现的频率，来准确地预测接下来会出现什么词语。这种多模态人工智能，正是破译动物语言可能需要的技术。即随着机器学习的发展，AI模型也加入了破译动物语言的行列，帮助人类提高翻译的速度。

现在的测试显示，大多数情况下，AI模型能够根据动物叫声准确识别物种，也能从重叠的动物声音中分辨出某一个体的声音。

除听懂动物语言外，科学家还有一个目标是让AI学会与动物对话。通过创建这样的AI模型，或许可以重新认识动物，进而促进动物保护与福利。我们是否能够理解动物的语言？我们是否能够与动物进行有效的沟通？这些问题不仅涉及到科学、技术、文化、伦理等多个领域，也关乎到人类和自然的和谐共处。

即随着人工智能技术的发展，尝试利用AI来解码动物的语言，甚至实现人与动物的对话，这不仅有助于揭示动物的认知、情感和社会性，也有助于保护濒危物种、改善人类福祉和促进跨物种的理解和合作。人工智能大语言模型帮助与动物对话，有代表性的案例如：

1.研判读懂海豚说话

为了理解海豚的语言，美国国家海洋哺乳动物基金会开发了一个名为CHAT的项目，旨在使用AI技术来识别和翻译海豚的声音，并与海豚进行实时互动。CHAT项目使用了一个水下设备，可以录制海豚的声音，并通过AI算法来分析声音的频率、节奏和模式，从而识别出海豚发出的特定声音单元。

这些声音单元被认为是海豚语言中的“词汇”，可以代表不同的对象、概念或行为。通过收集和标注大量的海豚声音数据，CHAT项目建立了一个海豚-英语双向词典，可以将海豚的声音单元与英语单词相对应，也可以将英语单词转换为海豚的声音单元。

这样，人类就可以通过水下设备向海豚发出特定的声音信号，并接收海豚的回应，从而实现与海豚的对话。目前CHAT项目，已经在加勒比海和墨西哥湾进行了多次实验，成功地与一些野生或圈养的海豚进行了交流。例如，在一个实验中，人类向海豚发出了代表“海带”的声音信号，然后看到海豚游向附近的一片海带，并将其带回给人类。

在另一个实验中，人类向海豚发出了代表“滑板”的声音信号，然后看到海豚玩起了水下滑板，并向人类发出了表示“好玩”的声音信号。通过这些实验，人类不仅能够验证海豚的声音单元是否具有一致的含义，也能够观察海豚的行为反应和情绪表达，从而更好地理解海豚的语言和思维。

2.研判读懂鸟儿说话

鸟儿是另一种能够发出丰富和复杂声音的动物，它们的鸣叫、啁啾和歌唱，不仅能够传达自己的情绪、需求和意图，也能够与其他鸟儿进行社交互动。鸟儿之间也能够通过声音来识别彼此的个体和群体。

为了理解鸟儿的语言，美国康奈尔大学的科学家开发了一个名为BirdVox的项目，旨在使用AI技术来识别和翻译鸟儿的声音，并与鸟儿进行实时互动。BirdVox项目使用了一个便携式设备，可以录制鸟儿的声音，并通过AI算法来分析声音的频率、节奏和模式，从而识别出鸟儿发出的特定声音单元。这些声音单元被认为是鸟儿语言中的“词汇”，可以代表不同的对象、概念或行为。

通过收集和标注大量的鸟儿声音数据，BirdVox项目建立了一个鸟儿-英语双向词典，可以将鸟儿的声音单元与英语单词相对应，也可以将英语单词转换为鸟儿的声音单元。这样，人类就可以通过便携式设备向鸟儿发出特定的声音信号，并接收鸟儿的回应，从而实现与鸟儿的对话。目前BirdVox项目，已经在美国多个地区进行了多次实验，成功地与一些野生或圈养的鸟儿进行了交流。

例如，在一个实验中，人类向一只知更鸟发出了代表“飞行”的声音信号，然后看到知更鸟展开翅膀并在空中盘旋，并向人类发出了表示“欢乐”的声音信号。

在另一个实验中，人类向一只金丝雀发出了代表“食物”的声音信号，然后看到金丝雀飞向附近的一颗果树，并将其中一个果实啄下来给人类，并向人类发出了表示“友好”的声音信号。通过这些实验，人类不仅能够验证鸟儿的声音单元是否具有一致的含义，也能够观察鸟儿的行为反应和情绪表达，从而更好地理解鸟儿的语言和思维。

王德奎 · 发表于: 2023-11-16 19:48:54

3.研判读懂狗说话

狗能够发出各种吠叫、呜咽和吱吱声，来表达自己的情绪、需求和意图。狗之间也能够通过声音，来识别彼此的个体和群体。为了理解狗的语言，匈牙利埃奥特沃什•罗兰大学的科学家，开发了一个名为“狗翻译器”的项目，旨在使用AI技术来识别和翻译狗的声音，并与狗进行实时互动。“狗翻译器”项目使用了一个智能项圈，可以录制狗的声音，并通过AI算法来分析声音的频率、节奏和模式，从而识别出狗发出的特定声音单元。这些声音单元，被认为是狗语言中的“词汇”，可以代表不同的对象、概念或行为。

通过收集和标注大量的狗声音数据，“狗翻译器”项目建立了一个狗-英语双向词典，可以将狗的声音单元与英语单词相对应，也可以将英语单词转换为狗的声音单元。这样，人类就可以通过智能项圈向狗发出特定的声音信号，并接收狗的回应，从而实现与狗的对话。

目前“狗翻译器”项目，已经在匈牙利多个地区进行了多次实验，成功地与一些野生或圈养的狗进行了交流。例如在一个实验中，人类向一只拉布拉多发出了代表“玩具”的声音信号，然后看到拉布拉多跑向附近的一个球，并将其咬住并摇晃，并向人类发出了表示“开心”的声音信号。在另一个实验中，人类向一只柴犬发出了代表“食物”的声音信号，然后看到柴犬跑向附近的一个碗，并将其中的食物吃光，并向人类发出了表示“满足”的声音信号。

以上例子，不仅能够验证某些动物的声音单元，是否具有一致的含义，也能够观察它们的行为反应和情绪表达，从而也可更好地理解“将一切用大语言模型作数学来处理”实验实验动物的语言和思维。

【2、用大语言模型作数学的基本原理是啥】

“将一切用大语言模型作数学来处理”，关键是要有机械化、自动化超强的电子计算机和量子计算机等现代化工具，但这只是个时间和资金问题。要掌握这些工具，有前节“用大语言模型研判读懂鸟语兽声”的一点简单介绍，要更大规模地扩展，我们还需懂得一些基本原理，如什么是大语言模型(LLM)和通用大语言模型（PaLM2）？什么是通用人工智能模型（AGI）等，这里先来说什么是AGI？

1、通用人工智能模型（AGI）是啥？

通用人工智能（AGI），也被称为人工通用智能或超级人工智能，是人工智能的一种理论形式，可以像人类一样学习和推理，有可能解决复杂的问题并独立做出决策，是一种能够完全模仿人类智能的行为，能够执行任何人类智能活动的计算机系统。

即人工通用智能，是指智能代理理解或学习人类所能完成的任何智力任务的能力。它是一些人工智能研究的主要目标，也是科幻小说和未来研究中的常见话题。AGI也被称为强人工智能、完全人工智能或一般智能行动，尽管一些学术资料将强人工智能这一术语，保留给经历过有知觉或意识的计算机程序。

强人工智能与弱人工智能（或狭义人工智能）形成对比，后者不打算拥有一般的认知能力；但相反，弱人工智能是任何被设计用来解决一个确切问题的程序(弱人工智能是指没有意识或没有与人相同的思想的程序)，在广泛的环境中满足目标的能力最大化。

这种类型的AGI，其特点是证明能够“将一切用大语言模型作数学来处理”化智能的数学定义，而不是表现出类似人类的行为，因为被称为通用人工智能。即AGI可以被认为是人工智能的更高层次，它可以实现自我学习、自我改进、自我调整，进而解决任何问题而不需要人为干预。通用人工智能的研究目标，是寻求统一的理论框架来解释各种智能现象，并研发具有高效的学习和泛化能力、能够根据所处的复杂动态环境自主产生并完成任务的通用人工智能体，使其具备自主的感知、认知、决策、学习、执行和社会协作等能力。

人工智能发展历经多次繁荣与衰落的周期轮回。1956-1974年的第一个黄金时代，见证了机器定理证明和逻辑推理的突破。而在1974-1980年，因过于强调通用求解方法，忽略了知识表征，导致了第一次寒冬。随后，1980-1987年迎来了发展的第二个繁荣期，知识库和知识工程是主要的研究对象。而在1987-1993年，由于“符号落地”和“常识获取”的发展制约，人工智能遭遇第二次寒冬。

1990年代至今，人工智能开始进入平稳发展期，分化成几个子领域，包含计算机视觉、自然语言处理、认知与推理、机器学习、机器人学、多智能体领域等。每个领域均出现过突破性的成果，但是每个独立的成果局限在自己的子领域中，人工智能距离达到人类通用且泛化的智能水平仍然相差甚远。

究其原因，正是目前所有的通用人工智能（AGI）研究，都还没有共识到“将一切用大语言模型作数学来处理”。所以，因对AGI的定义，各不相同，还没有公认的人类智能定义──来自不同领域的专家，从不同的角度定义人类智能。有些致力于AGI开发的人，旨在复制人类的认知能力，包括感知，理解，学习和推理，跨越广泛的领域。

与“将一切用大语言模型作数学来处理”不同的其他形式的人工智能，旨在执行特定任务的窄人工智能或弱人工智能。

他们虽然认为，AGI将执行广泛的任务，适应新情况并从经验中学习──AGI将推理世界，形成抽象概念，并将知识从一个领域推广到另一个领域。而“将一切用大语言模型作数学来处理”从本质上讲，AGI的行为就像人类一样，没有被明确编程这样做。

它的一些关键特征如获取大量背景知识：AGI将利用几乎任何主题的广泛知识库。这些信息将使其能够学习、快速适应并做出明智的决定。常识：AGI将了解日常情况的细微差别并做出相应的反应。它可以通过尚未明确编程的场景进行推理，并使用常识来指导其行动。迁移学习：AGI可以将从一项任务中学到的知识和技能转移到其他相关任务中。抽象思维：AGI可以理解和处理抽象的想法，使其能够解决复杂的问题并开发创新的解决方案。了解因果关系：AGI将能够预测其决策的结果，并采取积极措施，通过理解和使用因果关系来实现其目标。这意味着它可以预测其决策的后果，并采取积极措施实现其目标。AGI与其他形式的AI之间，主要区别在于其功能范围。

虽然其他形式的人工智能旨在执行特定任务，但AGI将有可能执行广泛的任务，类似于人类对AGI的追求，是一条漫长而曲折的道路；

AGI的历史始于1950年代中期，当时人工智能的早期先驱，对机器能够像人类一样思考的前景充满乐观。他们相信AGI是可能的，并将在几十年内存在。然而，他们很快发现这个项目比他们预期的要复杂得多。在AGI研究的早期，有一种明显的兴奋感。赫伯特·A·西蒙是当时领先的人工智能研究人员之一，他在1965年曾预言，机器将能够在20年内完成人类可以完成的任何工作。这一大胆的主张激发了亚瑟·克拉克的科幻经典《2001：太空漫游》等创作。

然而，早年的乐观情绪是短暂的。到1970年代初，研究人员显然低估了AGI项目的复杂性。资助机构对AGI越来越持怀疑态度，研究人员被迫开发有用的“应用人工智能”系统。因此，人工智能研究人员将注意力转移到特定的子问题上，在这些子问题上，人工智能可以产生可验证的结果和商业应用。尽管AGI研究几十年来一直被搁置一旁，但在1990年代后期，当马克·古贝德使用“通用人工智能”一词来讨论全自动军事生产和运营的影响时，它再次浮出水面。

到2002年左右，“通用人工智能”这个词，再次被重新引入并推广开了──尽管对AGI重新产生了兴趣，但如今许多人工智能研究人员声称，智能过于复杂，无法在短期内完全复制。因此，大多数人工智能研究都集中在技术行业广泛使用的狭义人工智能系统上。然而，一些计算机科学家仍然积极参与AGI研究，并为一系列AGI会议做出了贡献。例如想象一下AGI的潜在影响是：AGI的好处和机会是无穷无尽的，凭借其处理大量数据和查找模式的能力，AGI可以帮助我们解决长期困扰我们的问题──在这个世界里，机器可以解决一些最复杂的问题，从气候变化到癌症；在这个世界里，我们不再需要担心重复的、琐碎的任务，因为智能机器会照顾它们和许多更高级的任务。

具体一点它可以帮助开发治疗癌症等慢性病的新药和治疗方法；它还可以帮助我们更好地了解气候变化的复杂性，并找到减轻其影响的新方法。AGI还可以以无数种方式改善人类生活，专注于更具创造性和成就感的追求。即使AGI的发展也存在风险和挑战，它也还可以通过提高效率和更安全来彻底改变运输和物流等行业。

而且生成式人工智能的最新发展，使我们更接近实现AGI的愿景──像聊天机器人（ChatGPT）这样的用户友好的生成式人工智能界面，尽管这仍然完全基于解释人类产生的数据，但已展示出令人印象深刻的能力，如可以理解人类文本提示并回答无限主题等问题，以及通用人工智能（AGI）有可能彻底改变我们所知道的世界，从医学进步到太空探索等等，AGI可以解决人类最紧迫的一些问题。

而且通过各个领域专家的持续研究和合作，我们可以努力实现AGI造福社会同时降低潜在风险的未来。

2、大语言模型(LLM)是啥？

数学一直被视为人工智能的试金石。21世纪以来基础科学前沿理论研究，如超弦理论、圈量子理论、大爆炸宇宙论、黎曼猜想、质子化学组学等，它们的数学能力如何提升？突破语言模型的先天性不足，本身已成为当下人工智能领域关注的重点。

要说“将一切用大语言模型作数学来处理”，为啥通用人工智能模型（AGI）、大语言模型(LLM)和通用大语言模型（PaLM2）可以是数学？因为这是从第三极基础理论建模的前世今生出发的。

第三极基础理论建模不像20世纪开始的美苏两极称霸，它们的人工智能题材，有国家、种族、文化、信仰的区分。尽管“将一切用大语言模型作数学来处理”也有这些因素，但总的来说，第三极基础理论建模里，“将一切用大语言模型作数学来处理”是把人类作为一个整体出现的，是最能够引起不同文化、不同种族、国家的人们共鸣的一种人类命运共同体题材的“数学”。

例如，它的前世今生出发，类似“柯猜”描写的数学──是1904年庞加莱提出被列为七大“数学世纪难题”之一庞加莱猜想，之外的“庞加莱外猜想”：与空心圆球内外表面所包围的时空映射点内和点外，无撕裂的共形循环翻转，对映“科学是生产力”是一种不“撕破”翻转，是全人类共同的梦想；描写的噩梦、危机也是人类要共同面对的噩梦和危机，而成为连接全世界不同文化的桥梁。

王德奎 · 发表于: 2023-11-16 19:50:13

所以“将一切用大语言模型作数学来处理”，是结合当下最新研究成果，分析探讨大语言模型推理能力在数学领域的进展和挑战。

这包括如何准确衡量语言模型的数学推理表现；探讨模型在数学推理中生成结果错误率高的原因，以及可能的解决策略；研讨新方法、新技术，使模型在数学推理时产生更稳定、连贯的解题步骤；研讨如何让模型提升学习体验和效果；面向未来，语言模型在数学推理上的应用将如何改变传统的教学模式。

因为大语言模型实例的聊天机器人（ChatGPT）出现后发现，在生成文本段落、模拟人类对话及解决数学问题表现惊人的大语言模型，是这几年人工智能发展最热门的为数学基础科学前沿理论研究发展，注入了的一针强心剂，将会带来所有基础科学前沿理论AI研发应用的新范式并改变AI的生态格局。

先前两极称霸的人工智能模型、大语言模型，在以数学推理为代表的复杂推理上，是表现欠佳的，难以应对数学领域的研究难题的。

这是由于它们在数学概念理解与生成能力、可解释性与透明度、泛化能力、误差与稳定性、个性化与趣味性等方面存在不足，尚难满足基础教育应用的要求。而另一方面，第三极基础理论建模的通用人工智能模型、通用大语言模型，是一种基于深度学习技术的大型预训练神经网络模型，深度学习指的深度神经网络模型，是人工智能的分支“机器学习”下面的一种算法模型。

如大语言模型中的术语“大”，是指神经网络的大小，即参数数量及其训练数据量。由于其规模大且复杂，它们可以生成令人印象深刻的连贯且上下文相关的句子。如果只通过 GPT（生成式预训练）模型的演进规模来看：2018 年发布的GPT-1包含1.17亿个参数，9.85亿个单词。2019年发布的GPT-2包含15亿个参数。2020年发布的GPT-3 包含1750亿个参数。ChatGPT就是基于这个模型。

大语言模型(LLM)是一种强大的工具，可以在最少的人工干预下快速、准确地处理自然语言数据。这些模型可用于各种任务，例如文本生成、情感分析、问答系统、自动摘要、机器翻译、文档分类等。

凭借LLM快速、准确地处理大量文本数据的能力，它们已成为不同行业各种应用程序的宝贵工具。总而言之，大语言模型使机器能够更好地理解自然语言，并在处理文本时生成更准确的结果。通过利用深度学习神经网络等人工智能技术，这些模型可以快速分析大量数据并提供高度准确的结果，可用于不同行业的各种应用。

当大语言模型突破两极称霸的“先天性的缺陷”，成功应对数学方面的挑战时，世界人工智能将进入新的纪元，也能深入探讨大语言模型推理能力在数学领域的进展和挑战,分析如何提升大模型数学推理能力，展望大语言模型在数学领域的前景和研究方向。

大型语言模型通过学习大量的文本数据，包括数学教材、教程、论文和问题解答等，来理解和生成数学相关的文本。它们并不直接理解数学的本质，而是学习如何模仿人类解决数学问题的方式。

训练大模型如何解决数学题，分为两个层面。第一步是需要先给它提供很多的数学相关的数据，但这些数据并不一定都是数学题，有可能是论文、代码、科学文献、科学报道等。第二步大语言模型在数学上要有突破，就需要提供纯数学相关的公式、数据、内容。通过这两步让它在数学的解题推理上有一个提升。

对于一些简单的数学问题，如基础的四则运算、开根号等，模型可以直接生成正确答案。这是因为在训练数据中，这些类型的问题及其解答很常见，模型已经学习到了如何解决它们。

对于更复杂的数学问题，模型可能会尝试生成一种解决问题的方法或策略，这通常涉及到对问题的重新表述、将问题分解为更小的子问题、应用数学公式或理论等。由于模型并不真正理解数学，它可能会生成不准确或无意义的解答。在这些情况下，人类的指导和监督是必要的。同时尝试把大语言模型应用在数学领域的定理证明上，如需要证明定理的时候，可能需要一定量的定理来证明和支撑新提出的定理，但是每个人都不可能知道世界上所有的定理，这个时候大语言模型就会帮你找到它认为和新定理相关的，你可能需要用的其他定理。

总而言之，大语言模型是在巨大数据集上训练以理解人类语言的深度学习模型。大语言模型使机器能够像我们人类解释语言一样解释语言，彻底改变了计算机理解和生成人类语言的方式。大语言模型学习语言中单词之间的模式和关系，例如，它理解语言的句法和语义结构，如语法、单词顺序以及单词和短语的含义。它获得了掌握整个语言本身的能力。过去，语言处理严重依赖于遵循预定义指令的基于规则的系统。然而，这些系统在捕捉人类语言复杂而细致的方面面临着局限性，而深度学习和神经网络出现的生成式预训练（GPT-3），带来了变革性的转变，如2023年发布的GPT-4 它可能包含数万亿个参数。大语言模型(LLM)的架构由多种因素决定，例如特定模型设计的目标、可用的计算资源以及LLM 将执行的语言处理任务的类型。

LLM的总体架构由许多层组成，例如前馈层、嵌入层、注意力层。嵌入其中的文本相互协作以生成预测。大语言模型(LLM)由几个关键构建块组成，使它们能够有效地处理和理解自然语言数据。预训练是在针对特定任务进行微调之前，在大型数据集（通常是无监督或自监督）上训练LLM的过程。在预训练期间，模型学习一般语言模式、单词之间的关系以及其他基础知识。迁移学习是一种利用预训练期间获得的知识，并将其应用于新的相关任务的技术。在LLM的背景下，迁移学习涉及在较小的特定任务数据集上微调预训练模型，以实现该任务的高性能。迁移学习的好处在于，它允许模型从预训练期间学到的大量通用语言知识中受益，从而减少对大型标记数据集和每个新任务的大量训练的需求。大语言模型具有理解上下文、含义和语言的微妙复杂性的固有能力。因此可以生成连贯且上下文相关的文本。

大语言模型在问答和信息检索领域正在快速发展，将大语言模型集成到业务应用中会带来许多可能性，它们的潜力跨越不同领域，使其成为提高生产力和创新的宝贵工具。

3、通用大语言模型（PaLM2）是啥？

通用大语言模型（PaLM2）是一种基于自然语言处理技术的模型，它可以对自然语言进行理解和分析，并生成符合上下文意义的输出。

相比传统的自然语言处理方法，通用语言大模型具有更强的语言理解和表达能力，可以更好地处理自然语言的复杂性和多样性。

PaLM2对比于传统的语言模型，有以下方面的提升。首先，在数据规模上，PaLM2使用了超过100亿个单词的数据集训练，使得模型具有更强的应对多样化任务的能力；其次，在模型结构上，PaLM2引入了分层表示，并使用多任务学习与轻量级编码器和解码器相结合的方法，使得模型能够快速且准确地完成各种任务；最后，PaLM2在应用领域上也表现出了非常优越的匹配度和可靠性。

在自然语言处理领域，PaLM2可以广泛应用于问答系统、语音转换、机器翻译、推荐系统等多个方面，它为提高现代信息搜索的准确性与效率做出了重要贡献。在问答系统方面，PaLM2可以帮助机器理解用户的问题，并筛选并匹配相应的答案。它通过学习已有的语义间的联结路径，实现了对复杂问题的准确回答。在语音转换方面，PaLM 2可以识别出音频和文本之间的联系，并将其转换为可语音播报的文本信息。这为语音交互技术的发展带来了更多的可能性。在机器翻译方面，PaLM2可以优化跨语种翻译，并提高翻译结果的准确率。在推荐系统方面，PaLM2可以利用历史数据分析用户的兴趣，从而更好地预测用户的需求，并为其推荐合适的产品和服务。

通用语言大模型的发展历程可以追溯到2018年，当时谷歌发布了BERT模型，它是一种基于双向预训练语言模型，BERT模型的提出，标志着通用语言大模型的诞生。此后，越来越多的公司和机构投入到通用语言大模型的研究和开发中，推出了许多具有优异性能的模型。

通用语言大模型的设计思路，是通过大规模的语料库进行预训练，从而学习到语言规则和语义信息。预训练的过程是通过深度学习网络对语料库进行多次迭代学习，从而得到一个具有较强语言理解能力的预训练模型。在此基础上，可以通过微调等方法对模型进行进一步的训练，以适应不同的自然语言处理任务。通用语言大模型的优势，在于它可以自动学习和适应各种语言和任务，无需手动调整规则和参数。

通用语言大模型具有的强大表达能力和上下文理解能力，可以生成符合语境和语义的自然语言文本。此外，通用语言大模型还可以通过迁移学习和多任务学习等方式进一步提高其性能和泛化能力。

未来，通用语言大模型仍将是一个重要的研究方向和领域。随着深度学习技术的不断进步和数据资源的不断丰富，通用语言大模型将会进一步优化和改进，从而更好地服务于人类社会的各个领域。同时，随着人工智能技术的不断发展，我们也可以期待通用语言大模型在自然语言生成、自然语言理解、机器翻译等领域取得更多的突破和应用。

总之，通用语言大模型是一种具有强大语言理解和表达能力的自然语言处理技术，它在深度学习的支持下可以实现高质量的自然语言文本生成和处理。虽然通用语言大模型还存在一些问题和挑战，但是其巨大的潜力和应用前景使其成为一个值得关注和研究的重要领域。

4、人工智能数学指导文生图

“将一切用大语言模型作数学来处理”，什么是以文生图?

以文生图是通过文字描述，将文字转化为图像并展示出来。以文生图具有自动化程度高、精度高、可扩展。即文生图功能，也就是经由文本生成图像，这里面的“文”，广义的解释是指用户输入的文本或者图像信息，目的是指导模型根据一些特定的需求，生成我们用来告诉AI“我要画什么”，“画成什么样”的一种语言。

即“用文生图”，背后也是连接的语料库及数据训练的，是属于机器人工智能（AI）的竞争核心。那AI如何进入无人区提出、发现新问题的？由于ChatGPT能研究出来，说明原本认为是人类独有的心智理论，已经出现在ChatGPT背后的AI模型上。ChatGPT代替重复和低端脑力劳动，应该是一个趋势。既然是大量数据训练的模式，那么就可能只是统计概率。科学家没有研究出来的东西，通过研究，分解，消化，汉语化，如今，大语言模型变得越来越复杂，也越来越擅长生成和解读人类的语言，它逐渐产生了像心智理论一样的能力。

AI如何“用文生图”，我们来说一种“扩散模型”的技术。比如一只盒子，就是我们的AI模型，为了训练这个AI模型，我们给它输入带有标签的图像。接着它可能对数十亿计的图片开展分析，这些图片往往全是互联网上搜集来的，它开始“学习”用字词关联图像。

这就连AI模型的开发者，也不清楚AI到底如何学习的。有人讲，它或许是制作了一张内部地图，并为图像之间的关系，赋予了不同概率。就比如，人的脸上通常有两只眼睛，而狗一般长着黑色鼻子。

又如，有位科学家在输入的图像中，加入视觉噪音考验AI模型，它们好比一台老电视机上闪动的雪花，AI必须去除噪音，返回一幅清晰的图像。科学家一次次重复这个过程，每一次都用更多的噪音来模糊图像。一旦训练完成，AI就能读懂任意文本提示，它从一张只有噪音的图像入手，渐渐将噪音清除，最后得到一张与描述文字相符的新图像。

王德奎 · 发表于: 2023-11-16 19:53:16

【3、用大语言模型数学研判RNA等物质结构】

“将一切用大语言模型作数学来处理”，最为瞩目的下一个前沿，是生物学等物质结构，这包括大语言模型数学在化学物质结构推理上的应用，将如何改变传统的教学模式。例如，人工智能大语言模型数学技术，已成为破解生命复杂性难题的重要工具，即这种新兴的大语言模型数学技术有望从多个层次进一步提升生命科学研究。

而且，大语言模型数学最重要的长期训练机会，也需要一种完全不同类型的语言生物学语言来提升。这也是过去一个世纪，生物化学、分子生物学和遗传学研究进展的长征中出现的一个引人注目的主题。

事实证明结合当下最新研究成果，生物学是一个可破译、可编程、在某些方面甚至是数字系统。如蛋白质结构预测问题的提出，已经有60年的历史了，这也是一步步来前进的。

1、大语言模型数学研判RNA结构等学习

2023年11月10日科学网，周耀旗个人博客专栏发表的《RNA语言模型也来了！》一文，周耀旗教授介绍他的课题组，围绕着RNA和蛋白质的序列、结构及功能之间关系的基础研究，以及生物高分子的应用开发，其特色是，结构生物信息计算和现代高通量、自动进化生物技术相结合来实现对序列、结构及功能之间关系的深刻理解，从而达到生物高分子在多方面应用的目的，其中包括为精准医疗服务的针对性药物设计和个性化生物标志物的检测。

核糖核酸在体内的作用主要是引导蛋白质的合成，从头蛋白质设计，并不是生命科学中大型语言模型数学唯一令人兴奋的机会。大语言模型数学可用于生成其他类别的生物分子,特别是核酸。而核糖核酸（RNA），是存在于生物细胞以及部分病毒、类病毒中的遗传信息载体。RNA由核糖核苷酸，经磷酸二酯键缩合而成长链状分子。一个核糖核苷酸分子由磷酸，核糖和碱基构成。RNA的碱基主要有4种，即A（腺嘌呤）、G（鸟嘌呤）、C（胞嘧啶）、U（尿嘧啶），其中，U（尿嘧啶）取代了DNA中的T（胸腺嘧啶）。

“深圳湾实验室”是2019年由北京大学深圳研究生院与深圳市科技创新委员会共同创办，也称“生命信息与生物医药广东省实验室”。

周耀旗教授是2021年3月起，作为资深研究员全职加入深圳湾实验室的。他是1984年中国科技大学近代化学系的学士，1990年美国纽约州立石溪大学化学物理的博士，1994-2000年北卡州立大学、哈佛大学的博士后，2000年任纽约州立布法罗大学助理教授，2004年升为终身副教授，2006年成为印第安纳大学信息学院和医学院终身正教授，2013-2021年任澳大利亚格里菲斯大学糖组学研究所正教授。他的科研成果特别是在基于AI蛋白质设计和主链结构预测上做出了原创性贡献，截至目前共发表同行评审的论文260多篇。

“将一切用大语言模型作数学来处理”的下一个前沿热门应用方向，将包括但不限于生物学等物质结构。周耀旗教授介绍称，包括药物研发、计算生物和化学、材料科学、天文学、气象学和气候科学、核物理和高能物理学、机器人和社会科学等。它的潜在的商业价值，是体现在新材料、新药、新工农业产品的开发和服务、数据的分析和挖掘、教育和培训、科研的管理和咨询等方面。

2023年3月中国科学技术部，启动“人工智能促进科学”专项部署。其中深圳湾实验室系统与物理生物学研究所，围绕AI4S领域所开展的工作，现阶段主要在蛋白质和RNA结构的预测和功能蛋白质设计上，重点是开发和应用蛋白质和RNA新语言模型。这是一种基于深度学习的蛋白质结构预测方法，在从氨基酸序列预测蛋白质的3D结构方面，已取得了前所未有的准确性。成功有几个原因，就包括：

1）大规模训练数据：AlphaFold2是在超过170000个蛋白质序列的大数据集上训练的，这使得它能够学习氨基酸序列和3D结构之间的模式和关系。

2）深度神经网络：AlphaFold2使用一种称为图形神经网络的深度神经网络来预测蛋白质的3D结构。该网络被设计为，捕获蛋白质序列中氨基酸之间的关系及其在3D结构中的空间排列。

3）迁移学习：AlphaFold2利用迁移学习，这是一种深度学习技术，从一项任务中学习的知识用于提高相关任务的绩效。

该网络在一组大而多样的蛋白质上进行了预训练，然后对蛋白质结构预测任务进行了微调。

4）多尺度预测：AlphaFold2使用多个预测尺度，从预测蛋白质的整体折迭到预测每个氨基酸在3D结构中的精确位置。这使得它能够考虑蛋白质序列中不同水平的结构信息，并以高精度预测最终结构。

5）准确的评估指标：AlphaFold2使用许多准确的指标进行评估，包括全球距离测试（GDT），该测试测量预测结构与实验结构的准确性，以及蛋白质结构预测（CASP）评估框架的关键评估。

这些因素，加上先进的计算资源和算法，促成了AlphaFold2在蛋白质结构预测方面的成功。该方法已经在蛋白质科学领域产生了重大影响，预计将在药物设计和蛋白质工程等领域有许多应用。

最近大语言模型数学研判指导在生物高分子蛋白质上的应用，已经有20多个不同规模、不同应用的模型问世，在蛋白质结构和功能预测、以及蛋白质设计上发挥出越来越大的作用。与有20个氨基酸组成的蛋白质相比，RNA语言模型的开发更为困难，因为RNA仅由4种碱基的排列组成，序列保守性极差，从而利用无监督训练来捕捉其中的结构和功能信息的挑战极大。核苷酸序列AT(U)CG可以看作是一个有意义的文本，如果能破解它，那就从根本上解决了遗传学的问题。

周耀旗教授说：基于多序列比对RNA语言模型及其在结构推衍中的应用，他们已成功开发了一个无监督多序列比对的RNA语言模型。并决定开发基于同源序列比对、而不是基于单个序列的语言模型；因为发现基于BERT（双向编码器变换器）的RNA语言模型，无论是内部开发的，还是2022年在预印版arxiv上公开的，对三级结构包含的RNA碱基对的预测，没有带来任何明显的效果。

因此，提供多序列比对，然后让语言模型去提取进化和共进化信息可能会更加有效。但是，被认为是金标准的、人工收集标注的RNA家族（Rfam）里面只有4000个家族，而且每个家族里的RNA同源序列数的中位数只有45个，远远无法满足深度学习的需求。

所以，他们不得不利用自主研发的全自动RNAcmap3管线，来从自己构建的、目前最大的核酸数据库MARS中，利用RNAfold预测的近似二级结构、并通过Infernal来搜索具有相同二级结构的同源序列。这个搜索提供了远超Rfam的同源序列数目（中位数>2000）。

研究发现，这个多序列比对语言模型RNA-MSM所产生的二维注意力图和一维嵌入层，已经自动包含了结构信息，可以直接映射到RNA的碱基配对概率和溶剂可及性。通过进一步的微调，这一模型在RNA结构相关任务上表现出了大幅度的改善，超过了现有的技术，包括利用了进化信息的SPOT-RNA2【2】和RNAsnap2【3】。这一进展意味着RNA领域的结构推衍有了新的工具和方法，有望在RNA的结构和功能相关任务中发挥重要作用。另一方面该发现有望加速对RNA分子的理解，对生命科学、医学应用有为新药研发和疾病治疗带来更多可能。

2、大语言模型数学AI为火星移民解决氧气

《中国科学报》2023年11月14日，发表的《AI机器人为火星移民迈出重要一步》一文报道：中国科技大学教授罗毅、江俊、尚伟伟、朱青与中国深空探测实验室张哲教授等合作，通过前期研制的机器化学家“小来”平台，利用火星陨石制备出实用的产氧催化剂，“生产”出氧气。这也可以看成，又一个“将一切用大语言模型作数学来处理”指导研判化学物质结构的成功案例。

水、氧气是人类赖以生存的重要物质基础，但火星上，存在水资源，却没有氧气。在地球上，通过电催化析氧反应，以水为原料，能成功制备出氧气。那么在火星上，是否也可以实现这一目标？由于目前人类无法在火星环境下长期生存，因此无法“就地取材”在火星上制备产氧催化剂。大语言模型数学人工智能机器人──中国科大机器化学家“小来”，接到用火星陨石中的一些成分制备催化剂。

中国科大朱青教授说，他们实验中用的陨石，是真正来自火星的陨石。它里面包含铁、锰、镍、钙、镁、铝等元素，这些金属元素都是合成催化剂的必要成分。但火星陨石中的金属成分组合形成催化剂，大概有300多万种配方。如何在如此大的基数中快速找到最优配比？

大语言模型数学人工智能，能更好描绘整个高维空间中的化学反应走势，这是依靠人类传统经验无法实现的。即它展现出超越人类科学家的理论与实践能力的是，首先它利用自己的“计算大脑”，自主创建了一批理论构象，然后开始做大规模的理论计算。同时它通过其精准的自动化操作能力，快速高效地利用自身装载的激光诱导击穿光谱设备，对火星陨石进行了详细的矿物分析，将理论大数据与实验小数据对齐，就建立起了一个理实交融的机器学习模型，发现其中有很多种金属适合作为产氧催化剂的有效成分──理论模拟可以判断大致的优化方向，机器实验则能提供精准的实测数据。

于是它通过强酸浸渍，将矿物全部溶解，提炼出里面的金属组分；然后，加碱沉淀得到一个含多金属的氢氧化物；最后，以氢氧化物作为阳极催化剂，参与火星卤水的电解反应，从而制备出氧气。

该工作成功展示了在地外星系上，因地制宜创制化学品的智能化全流程，为未来地外文明探索提供了新的技术手段，为我国在月球、火星空间站上，实现星际资源的原位综合利用提供了独特方案。

即大语言模型数学人工智能，有“预测全局”的能力，可在数百万个配方中“推荐”出性能最好的配方。最终根据此配方再进行实验验证，经过6周243次实验成功利用5种火星陨石，制备出一款实用的产氧催化剂。而如果人类化学家通过“试错”的模式进行研究，这个工作可能需要2000年才能完成。这种理实交融的研究范式，极大加快了新材料发现的过程，能够从数百万种可能的配方中迅速识别出最佳组合。而用火星陨石制备的催化剂与地球上的催化剂有什么不一样？为何不直接将催化剂从地球带到火星上？

王德奎 · 发表于: 2023-11-16 19:54:12

江俊教授说：这里强调的是一种原位资源利用策略。在未来的火星移民、星际探索中，不太可能一直将地球上的物资运送过去。一是运输成本太高，二是地外环境下的化学反应情况跟地球上不一样，并且催化剂材料自身也有使用寿命。因此，最好的方法就是就地取材。

例如，AI机器人在无人监管的情况下，可利用未知的物质自主发现并且创造出有用的化学品。随着人类深空探测活动日益活跃，传统运载方式难以支撑未来空间任务的发展，需要不断减少对地球物质能源补给的依赖，原位资源利用技术就成为了重要手段。而地外原位资源利用指的是在星际探索的过程中，因地制宜采集当地的物质资源进行物理化学方面的改造，使其变成有用的化学品、材料、设施。

【4、用大语言模型翻转指导传统中医中医药学习】

1、大语言模型数学指导中西医翻转互学原理

“将一切用大语言模型作数学来处理”，又一个瞩目的是当前中医药高质量发展进程中的那些用现代科学解读传统中医理论的“高科技”──揭示未来百年之大变局的这种用大语言模型数学，是翻转指导传统中西医互学的数学原理研究。

虽然这早在1963年，研究就按下“暂停键”；之前没有出书，也没有宣传，但57年后遇到2020年这种突如其来的新冠肺炎疫情“封城”、“锁国”隔离，类似的孤岛和岛屿，就有人类社会、物理空间、信息空间所构成的三元空间转变，也有在类似孤岛和岛屿间架桥梁的“撕破”和“不撕破”两难之间作选择之困──新冠肺炎疫情发生后，世界加速从“人类社会”和“物理空间”构成的二元空间，向“人类社会”、“物理空间”、“信息空间”所构成的三元空间转变……疫情过后世界不会再回到原来的那个样子。

即突如其来的新冠肺炎疫情，“封城”、“锁国”隔离……疫情催生大量“云端见”常态化──网络会议、在线教育、线上会展，大数据智能、群体智能、跨媒体智能、人机混合增强智能和自主智能系统等人工智能方面的发展方向证明：类似“空心圆球内表面翻转成外表面”，还可以“不撕破”。而这正是在1963年之后57年中，事物的发展和理论探索，从“超弦”链接到“智能”──人工智能大语言模型数学，可以在类似“空心圆球内表面翻转成外表面”的过去百年之大变局中，呈现的“撕破”和“不撕破”两难之间作选择，要求柯召──魏时珍猜想，即前面说过的“柯猜”数学──1904年庞加莱提出被列为七大“数学世纪难题”之一庞加莱猜想，延伸的“庞加莱外猜想”：与空心圆球内外表面所包围的时空映射点内和点外，无撕裂的共形循环翻转不能丢。

三元空间产生“柯猜”，这类似新冠疫情大流行是联合国历史上最大的全球性的“翻转”之一──开展国际合作，践行多边主义，团结互助，是全世界有效应对新冠疫情等全球危机的唯一途径。

但“庞加莱外猜想”柯猜要得到承认，也需要在一个又一个类似于疫情考验上的真正扭转。这也是中文世界科学进一步发展，最终整体超越英文世界才表现。如2019年9月17日授予屠呦呦教授“共和国勋章”的国家荣誉称号；授予顾方舟教授“人民科学家”的国家荣誉称号。而“柯猜”联系对照翻转指导传统中医药和西医药学习，传统的中医药类似空心圆球的外表面，而近代的西医药类似空心圆球的内表面。

屠呦呦教授多年从事中药和中西药结合研究，突出贡献是创制新型抗疟药青蒿素和双氢青蒿素，成为中国首个诺贝尔医学奖获得者。顾方舟（1926-2019）教授突出贡献是闻名于世的脊灰糖丸疫苗的推广，让“脊灰”的年平均发病率从1949年的十万分之4.06，下降到1993年的十万分之0.046，使数以万计儿童免于致残，被称为“中国脊髓灰质炎疫苗”之父。而2019年9月16日上海“观察者”网发表《我希望中草药能像西药一样成分明确，疗效精准|造访翁经科》一文，翁经科教授说：“对于中国人来说，我们是吃着中药长大的，所以情感上很容易接受中医药这种疗法。但对于西方人来说，生病时突然要跟让喝完全没听说过的植物煮出来的苦汤，这很难接受’──这类似不相同、不相通的‘空心圆球不撕破的内外两个表面”。

翁经科教授说的：“我希望中草药能像西药一样成分明确，疗效精准”──医药量子多体理论的“量子序”，类似把以量子多体黑洞理论为核心的体系的应用，重心转移到《黄帝内经》、《伤寒论》、《神农本草经》这方面的经典解读中来，成为未来持续的热点，使中医药理论与前沿基础科学的相对论、量子论具有同等理论地位和意义，而把其提升医药发展、医药创新、医药便利等进步，归为类似“量子序”的一种“人类个体”多体人群。而把反相反量反中医，另归为类似“量子序”的一种“人类个体”多体人群。但这并不一定代表这种“量子序”进化论，就要一定分出正确和错误──“量子序”下面还要分“种属层次”，类似量子低能态和高能态，各有各的存在。

有人说：屠呦呦教授创制的新型抗疟药青蒿素和双氢青蒿素，不属于中医中药，而是打击中医中药──因为它属于西医西药。又有人说：凡是中国人成功创制疗效精准的医药，都应该算“中医中药”；因为中国人不是西方人；类似华为总裁任正非说，凡是有真正科学成就的人才和学问，引为中国所用，中国才能走向世界，为世界人民造福。

这种中医中药的宽窄争论，反映了传统中医药和现代中医药存在“对称破缺”，即有“能隙”。其实，即使现代成功过的前沿基础科学超弦理论，也有人声称“过时”了，有主张类似“各自为阵”的。

现在把中草药疗效精准，直接从文小刚教授说的量子序/拓扑序来解读，恐怕大多数中医药专家理解也困难。

翁经科教授说：“先要从中草药的特殊性讲起──植物不能运动，不能像动物一样靠运动对抗或逃避捕食者，所以植物采取了大量合成代谢产物的方法，来对付捕食者──特别是昆虫”。这种“能隙”激发产生，翁经科教授是从中草药相比西药这种单分子药物来说的。

因为植物不能运动，要对抗或逃避捕食者，“能隙”激发生代的谢产物中，有些也能对人类或人体内的病原生物产生活性，也就是所谓的药效──但因为植物不是为了人类治病，而演化出合成次生代谢产物的能力，所以按现代药学的用药标准──主要是药效明确，副作用小这两条，绝大多数草药中的天然产物，都不是理想的药物──要么药效不明确，要么副作用大──它的化学成分复杂很多倍──在不同时间种，不同地方种，植物的化学成分也不一样。

做临床测试时，就会每一次结果都不尽相同。而中草药单方，往往是数种乃至数十种植物混合在一起，所以很难知道这么多种成分里哪一种有用？能针对哪个病症的靶点起作用？而且中草药都是靠种出来的，还会有一些药农在萃取了草药的有效成分后再销售给药厂；对于药品企业而言，中草药的生产链条太长，质量追溯体系很难建立。

因为中草药的治病机理太复杂，天然草药的成分又往往不能满足用药标准，以往中草药的成分和疗效都是不明确的，因此它会被西方医学视作安慰剂。但只要当中草药能变得像西药一样成分明确、疗效明确时，它自然就去神秘化了。而且相比西药这种化学药物，中草药能更多地治疗系统性疾病，如心血管、老年痴呆、癌症等。

现在科学家通过大语言模型数学基因组学和生物信息学，能知道为什么？怎么做？用现代生物学和基因组学的方式，去帮助中草药形成现代化的转变──这也是中草药去神秘化在这方面的探索。

即可以通过大语言模型数学基因组学、代谢组学、转录组学等，在非模式的生物里找到合成特异性──这在过去，找到一种合成路径可能需要一整个研究团队花10多年，但现在，大语言模型数学用基因的高通量测序，结合系统生物学去研究，现代中医药一个研究员，大概三四年就能找到一种合成通路。

2016年2月23日美国艾尔弗•斯隆基金会公布2016年斯隆研究奖，翁经科教授获此殊荣。翁经科，1982年生，杭州人。他父亲是浙江大学地质系的教授。1999年他考入浙江大学，2003年获浙大学生物技术专业学士学位。2009年翁经科获普渡大学生化博士学位，2009-2013年在索尔克生物研究所从事博士后研究。现就职美国麻省理工怀特黑德生物医学研究所，研究员兼麻省理工学院教授。

翁经科教授说：“其实西方医学，崛起只有短短一百多年的时间，它对很多疾病，一些相对简单的疾病，像细菌感染，炎症或者疼痛，有非常好的疗效，但是对很多系统性疾病，比如说糖尿病、癌症、神经性退行疾病，以及心血管病，却未能有满意的疗愈。实际上中医，是基于几千年的人类经验所积累的可以治疗疾病的一套方法，而且我们中华民族五千年来就是靠这样的医学存活到今天的，为什么不能以西方的科技加上系统生物学的知识，去完成中医的现代化？”

再说中医看病用的听诊器普及，是从解放初期就开始的；以后听诊器，已成为人们看惯的中医生连带的印象──解放初四川山区偏僻贫瘠的农村，看病的时候找乡政府认定的医生，主要都是中医生；听诊器是内外妇儿科医生最常用的诊断用具，也是中医生的标志。所以现在的老人听说：“一个真正的中医生是不用听诊器的”，倒有些反感。中医的大数据、云计算，涉及阴阳对立互根、消长转化，以及干支甲子系统和五行五运六气规律等的统一归纳和演绎，其排列组合信息量之大，变换之多，没有强有力的中医科学天眼天网仪的探索与应用，是难以溯根求源，精准掌握病貌、诊断、中药等的组装的。

王德奎 · 发表于: 2023-11-16 19:54:57

中医药的大数据、云计算，类似《黄帝内经》里“气”的概念，其组装包含有集成、耦合、整合、叠加、网络、纠缠、沟通、通连、关联、联系等意思，用以阐释人体的生理、病理及人与自然的关系时，有很多叫法和大的组装分类：如一是依部位定名，有自然界之天气、地气；疠气疫气；脏腑之气；经络之气。二是以性质作用表现定名，有组装人体之“气”的阴气、阳气、正气、邪气，以及精气、神气、真气、宗气、营气、卫气等。中医药天眼天网仪可分为两部分：一是供溯源防御用的中医天眼天网仪，或“弦网凝聚中医药智能手机”，小巧方便，病人或常人都可以携带。二是供医院医生的中医天眼天网仪，或“量子色动中医药机器人”，是将寻诊人携带的中医天眼天网仪中收集储存的大数据，取下来换作治疗的小数据处方建议。

2、大语言模型数学助力中医的现代科技

2023年11月10日《晚霞报》发表记者李纯的文章《现代“黑科技”助力传统中医》，报道在浙江省湖州市安吉县天荒坪镇横路村卫生室，已有了类似大语言模型数学助力的一间24小时“云诊室”。

这可以联系新冠疫情催生大量“云端见”常态化──网络视频、线上会展……类似“空心圆球内表面翻转成外表面”。这里的诊室网络，它的另一头连接着安吉县中医医院急诊科。医生在线开具处方，村民付费后，拿着打印的二维码在一旁的云药柜上扫一扫，药品就会自动掉出来。如横路村卫生室中医师潘愫愫向记者李纯介绍中医诊疗AI眼镜：开具处方的时候，这个眼镜就相当于上级医院医生的眼睛，能够看到包括患者的舌苔、面色等等。即实现“24小时自助看中医”的背后，是大语言模型数学，成助力中医药科技创新提供的技术支撑。

人工智能大语言模型的运用，拉近了医患距离，更提高了中医药诊疗的效率。在安吉县中医院的药房，药剂师奚晓华告诉记者李纯，医院药房共配备了三台全自动抓药机器人：一是有人为设定，二是有机器校验，能够保证不会抓错药。一天最多曾配过500张颗粒剂处方，配药精度高于当前行业标准，所需人力仅为全人工配药的一半。

记者看到一边是药剂师在照方抓药，另一边是全自动机械臂在药库间往来穿梭。中新社记者李纯，是随中国国家中医药管理局赴上海、杭州、湖州等地调研，了解到当前这类中医药高质量发展的进程的。

而且在大城市，还比安吉县天荒坪镇横路村卫生室更不一般。在上海龙华医院，上海中医药大学/上海市中医药研究院脊柱病研究所的实验室内，这些现代医学的实验器材似乎很难与传统中医药的针灸药石联系到一起。在杭州市中医院国医馆的候诊大厅里，记者看到一台智能机器人正缓缓走向前来问诊的患者。市民只需扫描二维码、伸出双手、对着屏幕吐吐舌头，再填写相关问卷，就能获得中医体质报告、在线诊疗、远程问诊等服务，体验“云端上”的望闻问切。

所以随着大语言模型数学助力大数据、云计算、人工智能等技术，在医疗领域的应用就愈加广泛。如2021年杭州市中医院牵头申报的由中国工业和信息化部、国家卫生健康委员会联合开展的5G+医疗健康应用试点项目，将5G、AI等信息技术应用于中医领域。

再说“中医治未病”智能机器人，只是大语言模型数学助力中医药诊疗用上的“黑科技”之一。今天的中医药诊疗充满科技感，不仅能在移动端随时随地看诊，还可以实现远程实时问诊，在家门口为民众提供来自中医名医的高质量诊疗服务。这只是当前大语言模型数学助力中医药科技创新研究的一个缩影。依托教育部重点实验室和国家中医临床研究基地，科研人员用大语言模型数学助力现代化科学的方式解释传统中医原理，在疾病症候辨识、中医疗效评价、疾病预后判断、新药靶向研发等方面，取得了一系列突破性高质量发展。

【5、用大语言模型创新质子组学等研判】

21世纪以来基础科学前沿理论研究，如超弦理论、圈量子理论、大爆炸宇宙论、黎曼猜想、质子组学等，对比当前人工智能的火热显得停滞不前──其实这在第三极基础理论建模看来，并不是这样的。

例如，地球存在磁铁一类的物质，使大家都知道有磁场磁力线一类的自然现象。但“磁力线”是物质吗？传统科学到21世纪以来的基础科学前沿理论研究，并没有答案。但“将一切用大语言模型作数学来处理”超弦理论、圈量子理论、大爆炸宇宙论、黎曼猜想、质子组学化学等基础科学前沿理论研究，既然超弦理论、圈量子理论研判是弦线、圈线产生的基本粒子等物质，那么说明“磁力线”，不正是弦线、圈线产生基本粒子等的“残存物质”吗！

又如用大语言模型数学创新质子组学等研判，自然与社会全息砖智慧是可以统一的。具体证明是量子“好质子数”的波函数、密度泛函、杂化泛函等的综合公式Z=（3×N）+（4×n），解密的是元素化学实验质子数时空可分和不可分的变化，可研判从普通化学反应到核化学反应，都是以元素周期表中元素原子的原子核所含的质子数不讲大尺度结构──部分子无标度性实在的量子色动化学。

1、大语言模型数学创新隐秘的质子数有多奇？

元素周期表似乎为所有化学元素打造了一个“智慧大脑”──把物理化学世界的运动信息，表征成一系列拥有质子大小数量排列的数学，问题的关键是要识破复杂质子数背后隐秘的特殊数学结构，化繁为简，又只能是利用捉襟见肘的人类“智慧大脑”资源来完美破题。

质子时空观测到的原子核横向摇摆现象，完美破题了吗？没有。

因为目前全球“科技圈内”的理论化学物理学家，还少有人进入到量子色动化学这个领域。但这里别有洞天，如把元素周期表中的原子序数Z，等价为所含的质子数Z，“好质子数”质子组学说“全息砖”，从卡西米尔平板对效应、原子经济性、弦方形成的经济性、利用率、副产物、能源、安全等出发，“好质子数”的波函数、密度泛函、杂化泛函等综合，公式与“3N”和“4n”等个数变量函数的数字3、4、6、8、7、12、14、16等数量选择相关，已拟设有如下公式：

Z=（3×N）+（4×n）（5-1）

例如，铅（Pb-82Z）、磷（P-15Z）、铜（Cu-29Z）、氧（O-8Z）等元素，其原子核质子数波函数就有：

铅（Pb-82Z）：Z=（3×N）+（4×n）=（3×14）+（4×10）=82；

磷（P-15Z）：Z=（3×N）+（4×n）=（3×5）+（4×0）=15；

铜（Cu-29Z）：Z=（3×N）+（4×n）=（3×7）+（4×2）=29；

氧（O-8Z）：Z=（3×N）+（4×n）=（3×0）+（4×2）=8。

即铅（Pb-82Z）的“好质子数”相当于7个碳元素质子数弦方结构（6×7），再加上5个氧元素质子数弦方结构（8×5）。

磷（P-15Z）的“好质子数”相当于2个碳元素质子数弦方结构（6×2），还剩下一个“好质子数”3。

铜（Cu-29Z）相当于3个碳元素质子数弦方结构（6×2），还剩下一个“好质子数”3：再加上1个氧元素质子数弦方结构（8×1）。

氧（O-8Z）的“好质子数”相当于1个氧元素质子数弦方结构（8×1）。为啥？但这不是从元素周期表到核武器引爆原理“原子”研究的高科技，发展到极端的纯科学。

这个纯科学叫“量子色动化学”，它的原理是：分子结构不变，里面的原子粒子之间的距离尺寸可以有限变动；原子结构不变，里面的质子之间的距离尺寸可以有限变动。

2015年《环球科学》杂志6月号发表的《胶子与夸克怎样塑造宇宙》一文，开篇就讲“利用可以窥探质子和中子内部的实验方法，科学家发现：凝视一个质子或者中子的内部，看到的是一种动态的景象。除了基本的夸克三人组之外，还有一个由夸克和反夸克组成的海洋，以及突然出现又消失的胶子。这种量子色动力学的众多细节，仍然难以捉摸。量子色动力学有一个惊人的推论：我们所熟知的质子，其内部的胶子和夸克的数目可以发生幅度相当大的变化。一个胶子可以暂时地变为一对夸克和反夸克，或者变成一对胶子，然后又变回成一个胶子。在量子色动力学中，后者这样的胶子振荡比夸克交换更为普遍，所以胶子振荡占了主导地位”。

这个发现，还摘取过诺贝尔物理学奖。但由此，量子色动力学推论的所有的这些发现，都还没有结合量子色动语言学-量子色动几何学-量子色动化学等来联系普通的化学。如物质中的氧、碳、钾、钠、鈈、铀、氢、锂、铍等元素的质子数和可变的中子数，可能产生的两大类无或少放射性的多级放热放能反应。例如，把类似根据原子序数从小至大排序的门捷列夫化学元素周期表中，元素原子核里的质子看作“编码质点”，中子看作“非编码质点”。

这类似一种初级的量子色动语言学的动力学编码，可对各种化学物质及其组成的分子、原子、原子核的反应信息集成，做成类似大数据、云计算分类。因为量子色动化学能根据量子卡西米尔平板吸引效应原理，再利用量子色动几何学，对由“编码质点”和“非编码质点”引起的量子色动化学振荡反应，可进行大数据、云计算中的选择小数据处理。这能具体可用碳基和氧基的“编码质点”，来说明由量子色动化学振荡反应，影响显物质分子里的原子数不变产生的反应：

第一类是“编码质点”非核衰变化学反应的多级放热放能的元素离子分解，和组合的“马成金实验”氧、碳、钾、钠、氢的现象。这类量子色动化学振荡反应产生的爆炸，类似“钾钠+碳氮+水H2O”影响氧基量子卡西米尔效应的暗能量波动，大能量的热效应使水分子和HO离子等多种物质，发生瞬间量子色动化学振荡的多级循环重复的分解和组合反应。第二类是“非编码质点”数分解裂变和组合聚变的鈈、铀、氘、锂、铍等同位素，少核衰变的多级放热放能核反应的现象。这类量子色动化学振荡反应产生的爆炸又分两种情况。

其中第一种，是重在聚变成分非常大而裂变小的扳机型：类似“鈈+钾钠氮碳+氘化锂或氘氚化锂，或者氘化铍或氘化铝锂，或者重水D2O重氢(氘)或超重氢(氚)”，影响鈈基量子卡西米尔效应的暗能量波动，加快发生瞬间产生高温高压量子色动化学振荡的氘锂铍等混合物，放出大量中子的多级循环聚变反应。

王德奎 · 发表于: 2023-11-16 19:59:01

第二种，是重在裂变成分非常大而聚变小的扳机型：类似“铀-238U、235U或鈈+钾钠氮碳+重水D2O重氢(氘)”，影响铀基量子卡西米尔效应的暗能量波动，发生瞬间量子色动化学振荡的多级循环，加快重水聚变放出大量中子及铀等混合物质子或者中子内部的虚胶子和夸克的数目，可以发生幅度相当大的变化振荡，联系真空量子起伏和真空中类似两块平行金属板之间存在某种吸引力，这种吸引力被称为卡西米尔力；这样可以把原子核里的质子，按卡西米尔平板效应的系列化，编排成相似于门捷列夫元素周期表但图形不同的造型。

这可以少核辐射的核武器作证据。如据英国媒体报道，现今世界上的核武器弹头，美俄两国要占90%。联合国五大常务理事国研究、生产的核武器弹头，是属于核化学解释的第二类是“非编码质点”数分解裂变和组合聚变的鈈、铀、氘、锂、铍等同位素，少核衰变的多级放热放能核反应的现象──核化学解释核武器研究、生产核武器弹头的显著特点，是有核辐射的放射性反应，会造成难以长久消除的核污染。但由于门捷列夫发表元素周期表公开以来的模拟、延伸和扩展，诞生出量子色动力学、拓扑物理学和量子色动化学等科学原理，人们已经能够懂得朝鲜仅把这种原理研究，变为核武器生产方面有突破，超过了其它有核武器生产能力的国家,类似属于第一类是“编码质点”非核衰变化学反应的多级放热放能的元素离子分解，和组合的“马成金实验”氧、碳、钾、钠、氢的现象。

证据是2018年美国总统特朗普与朝鲜领导人金正恩在新加坡会晤前，6月24日朝方从上午11时许开始爆破拆除活动，到下午4时17分，核试验场的2号坑道、3号坑道、4号坑道以及营房、冶炼厂、观测所、宿舍等都接连被炸毁拆除，成为世界舆论焦点的核试验场终于被废弃。丰溪里核试验场位于咸镜北道吉州郡，距离平壤约130公里，距离中朝边界100多公里。从2006年10月开始，该试验场共进行了6次核试验。央视2018年6月24日后以来，多次公开朝鲜炸毁核试验基地的几幅照片，可以看到核爆炸试验基地周围是青山绿水，山上树木葱茏。这是所有其它试验过核武器爆炸的国家,没有一个国家是在距离首都约130公里的地方建立核爆炸试验基地情况的，一般是选择在远离人居密集的沙漠、荒原或远海的岛屿上。

少核辐射的核武器作证据，是普通化学解释和核化学解释研究、生产核武器原理的模拟、延伸和扩展的量子色动化学，它解释研究、生产的核武器，显著特点是核辐射的放射性小。

这可对应2016年1月6日朝鲜在丰溪里核武试验场进行的第四次核试验放射性小的证据：我国环保部在得到消息后第一时间启动了应对朝鲜核试验辐射应急预案，并进入二级(橙色)应急响应状态，利用自动监测站和实地取样分析等渠道，全面开展东北及周边地区辐射环境应急监测、人工放射性核素采样分析以及技术研判工作。

2016年1月6日我国边境地区25个自动监测站，实时空气剂量率监测数据在65至95纳戈瑞每小时之间，监测结果均在当地本底范围内。俄罗斯水文气象局发言人称，朝鲜进行氢弹试验后，未发现滨海边疆区辐射异常。俄罗斯水文气象局发言人称：“朝鲜进行氢弹试验后，未发现滨海边疆区辐射异常。符拉迪沃斯托克的本底辐射水平为9毫西弗/时，甚至低于可允许范围。鉴于朝鲜宣布实施氢弹试验，日本政府1月6日召开“放射能对策联络会议”，决定强化对放射性物质的监测。据原子能规制厅介绍，在朝鲜宣布实施氢弹试验之后，日本国内辐射量未见异常。据日本规制厅介绍，2006年至2013年朝鲜共实施三次核试验，均未观测到辐射量异常。

但至今没有专家承认自己凡核爆大都有放射性辐射泄露，与有关监测尚无发现核物质报导，作矛盾分析有误。

2、抗核武器锁死开关与设立联合国纪委之必要

门捷列夫元素周期表发展到核物理化学层次，出现二重性──有造福于人类的一面；也有产生今日“武统”的全球核战争和核讹诈、核威慑的情况。核武器，给人类和科学带来毁灭后果的一面，那么有没有门捷列夫元素周期表到核物理化学层次的进一步发展，能产生“锁死”重杀伤性武器的对核武器的“锁死开关”的研究呢？

因为如果利用类似量子纠缠隐形传输等量子力学二次革命的成果，给核武器“上锁”，也许加上新时代人类命运共同体打造的新型大国关系，和有强有力的联合国安理会执法机构，如果有“锁死开关”和能引爆违法的原子弹、氢弹，就可确保核武器一直处于控制之下。

因为“锁死开关”是与武器的核心芯片或弹药组装，有量子纠缠和区块链的关系，要去除“锁死开关”，等于作废整个东西。而核武器的“锁死开关”原理，类似对核武器引爆等原理装置的探索研究。

借此大语言模型数学创新质子组学，观之今天我们生活的地球，发生俄乌冲突、巴以冲突、印巴冲突……其实自然与社会全息砖智慧是统一的，即搅动全球人类社会历史序的国家政体国王、政权政党和宗教的领袖等人物，也可联系质子组学化学，是类似宇宙中地球这颗行星“原子”的“质子”和“质子组学”。他们这类“质子”，有的争强、争霸、争权利，造成的不安全；他们所在国家的人民管不了这种“第一把手”，但世界人民是有责任管这种“第一把手”的。如何办？

今天不是有“联合国”这种世界的统一组织吗？可以学我们中国的共产党，设立有“中央纪律检查委员会”，可以管中央下面一级所属部门的“第一把手”。“联合国”也可以设立“联合国纪律检查委员会”，代表世界人民管联合国下面所属各国政体国王、政权政党和宗教的领袖这类“第一把手”。这与抗核武器锁死开关配合，以保平安。

3、量子色动化学质子组学的由来与前世今生

量子色动化学质子组学，这里是把质子和中子等粒子，类似都看成是“平等的人”。但在结构的代表性上，类似政权、政党现象中，领导核心和其他成员的编码作用是不同的。

把卡西米尔平板对效应力引进到原子核，如果质子数不是一个简单的强力系统，而是有很多起伏，就能把“碳核”包含的相当于卡西米尔力平板的“量子色动几何”科学“细节”设计出来。

因为氧核的8个质子构成的立方体，形成3对卡西米尔平板效应，这种“量子色动几何”效应是元素周期表中其他任何元素原子的原子核，所含的质子数的“自然数”不能比拟的。这其中的道理是：形成一个最简单的平面需要3个点或4个点，即3个点构成一个三角形平面，4个点构成一个正方形平面。卡西米尔效应需要两片平行的平板，三角形平板就需要6个点，这类似碳基。

正方形平板就需要8个点，这类似氧基。如果把这些“点”看成是“质子数”，6个质子虽然比8个质子用得少，但比较量子卡西米尔力效应，8个质子点的立方体是上下、左右、前后，可平行形成3对卡西米尔平板效应，即它是不论方位的。构造一对和3对卡西米尔平板对效应的量子色动几何“游戏”及量子色动化学生成元“游戏”，这种分层级的“卡西米尔元素周期表”膜世界，由此产生氧核、碳核及其变体等类似张乾二式多面体的量子色动化学能源器。

即“6”算“好质子数”，“8”是更好“好质子数”──类似正方形的8个顶点，在局域和全域都是最接近、最简约的上下、左右、前后三对卡西米尔效应平板的经验图像和先验图像。但对于所有的自然数，甚至包括所有的实数、复数来说，是无限的多。

而由于“8”只有一个，所以8的概率在自然界是无限分之一，即再没此奇迹能发生。这是把原子核里的质子，按卡西米平板对效应的系列化，用于弱力能源研究解密的量子信息原理：

原子核不是一个简单的强力系统，而是在接轨有很多的虚量子起伏；这在原子核内部空间中，如再受到外界放入的弱力能源粉反应的“共振”，会是一种比原子核弱力效应大尺度得多的情况，它能够以一种通过同位素质谱仪以及严格的色谱-质谱联用的检测结果的方式，测量到这类弱力能源反应的起伏。如由多个“好质子数”说的“6”和“8”，组成的质子弦方体系写入“6”和“8”的信息点阵（类似说超导的“偏好”），由此信息点的写入-擦除和再写入，是新功能材料和隐式能源的宝库。其质子有序组合体建筑学、热力学、动力学效应，都有待进一步揭示它的由来。它的前世今生，说来话长：

1869年门捷列夫提出极简的《门捷列夫元素周期表》，154年来已经引发从拓扑物理学到量子色动力学结合，揭示科学+统计=量子起伏+卡西米尔平板对效应=智能手机+刀片基站=人工智能+统计，已涉及从原子弹、氢弹的核辐射等原理，到涉及室温常压超导体的探索。

这要联系的量子卡西米尔效应现象，是荷兰物理学家卡西米尔在1948年发现提出的。随后它被很多科学家也侦测到，但卡西米尔发现卡西米尔力时，夸克、胶子之类的量子色动力学还没有出现。

卡西米尔等科学家的探索，还只停留在原子核和电磁场物理学层次以上，这时的观念还只是一种源于电磁场的量子真空起伏的力。对这种由于在真空状态有量子力的波动，两个距离非常近的物体之间存在的奇怪的拉力或推力（类似说超导的“收缩”），被称为卡西米尔效应。但这时的卡西米尔效应是源于的量子力波动的量子，人们主要还看成是“实粒子”。它可以上推论到海浪等液体的水分子、空气等风流动的空气分子，也能产生卡西米尔效应。

但数学上“数”有分正、负；虚、实；零等5种的区别，联系实粒子和它的负粒子，在这种卡西米尔效应真空中，两片平行的平坦金属板之间产生的吸引压力，与牛顿、爱因斯坦发现的万有引力，其深层次的物理原理是不同的。在大语言模型创新数学基本推理原理上，深化这种联系要等到今天对爱因斯坦的广义相对论和量子色动力学，追踪到原子核和电磁场物理学层次以下，出现量子引力和暗能量、暗物质、暗信息、弦论等问题的考察时，才有说得清楚的思路。

而“好质子数”之说，最先源于与焦克芳教授关于“地壳元素核素衰变猜想”的试解──2009年7月28日中国军事医学科学院药理毒理研究所研究员焦克芳教授，提出地壳元素核素衰变猜想，说他“发现地壳元素中分布最多的前12个元素的形成规律──地壳中元素含量排序：氧(45.2%），硅(27.2%)，铝(8%)，铁(5.8%)，钙(5.06%)，镁(2.77%)，钠(2.32%)，钾(1.68%)，钛(0.68%)，氢(0.14%)，锰(0.10%)，磷(0.10%)，为什么这些元素在地壳中含量最多？

“特别是其中，偶偶核素8氧16（8个质子，8个中子）含量最高，其次是偶偶核14硅28、12镁24、26铁56、20钙40和22钛46也是偶偶核素，可以理解。但是，奇偶核素13铝27含量居第三位；11钠23、15磷31、19钾39、25锰55都是奇偶核素，为什么？

王德奎 · 发表于: 2023-11-16 19:59:22

“如果把氢核素加上，偶偶核素与奇偶核素各占一半。但是却没有一个是奇奇核素，例如，3锂6、5硼10、7氮14等。为什么大多数偶奇核素天然相对丰度较低，例如，8氧17（0.038%），括弧内为天然丰度、14硅29（4.67%）、12镁25（10%）、20钙43（0.135%）、26铁57（2.1%）。为什么天然相对丰度达到100%的核素都是奇偶核素？例如，11钠23、13铝27、15磷31、25锰55等。表面上看，毫无规律的地壳元素组成，其实有着秘密的内在联系，就好像有一只黑手那样，一直操纵着地壳元素的形成”。

对此，焦克芳教授征求我们的解答。我们给他的回信中首先指出：焦克芳教授说那前12种元素的排序，在不同的资料中，有一些出入。其次他提供的锰(0.10%)，磷(0.10%)排序，丰度同为0.10%，却有先后，说明数据不准。接下来的元素的排序，也许存在更大的出入，这说明所谓“偶偶核素与奇偶核素各占一半，没有一个是奇奇核素”的规律，不一定能推理下去。原因是：

（1）地球地壳中的化学元素丰度查对，我们根据百度维科，搜索到包括5份不同资料来源得到的结果，它们说明其中的数字估计值，会随着资料来源及估计方式不同而改变，因此只能作大致上的参考。与焦克芳教授提供的稍有不同排序的其中之一是：

1）氧(46.60%）；2)硅（27.72%）；3）铝(8.13%)；4)铁(5.00%)；5）钙(3.63%)；6）钠(2.83%)；7）钾（2.59%）；8）镁(2.09%) ；9）钛（0.44%）；10）氢(0.14%)：11）锰(0.12%)；12）磷(0.10%)。

（2）这个排序，提供了锰和磷的丰度差别。其次，虽然钠、钾、镁的排序与焦克芳教授的不同，但前12个元素都是相同的。地壳元素中分布最多的前12个元素的形成规律，到底受哪些因素影响？

众所周知，英国著名数学家和天文学家霍伊尔，解决了化学元素的宇宙起源问题，是应该获得诺贝尔科学奖的。1954年他已证明从氦到碳这些轻元素能够在温度为1亿开的红巨星中产生；1957年他和伯比奇夫妇、福勒四人提出了著名的B2FH元素合成理论；1967年霍伊尔、福勒和瓦戈纳合作，用大爆炸理论解释了所有其他轻元素的起源。但1983年的诺贝尔科学奖却只授予了福勒。

（3）1996年我们发表的《物质族基本粒子质量谱计算公式》等论文，部分支持霍伊尔的大爆炸理论解释轻元素起源的假说。因为该组公式能把物质族的61种基本粒子──即48种费米子、13种规范玻色子的质量一一算出，这正是基于类似膜的撕裂的宇宙大爆炸的时空大撕裂模型得出的。从霍伊尔到基本粒子的质量谱公式能说明轻元素的起源，氢是最简单的轻元素，也是元素周期表中所有元素原子中最轻的元素，作为是宇宙大爆炸后最先的元素起源，氢已成为地壳元素中分布最多的前12个元素形成的丰度背景，把氢和氢以后接下来的元素的排序，列入地壳元素中分布最多的元素形成规律的寻找，已没有意义。所以把焦教授所说的那前12种元素排序，从氢开始删去，对剩下的氧、硅、铝、铁、钙、镁、钠、钾、钛或氧、硅、铝、铁、钙、钠、钾、镁、钛等9元素排序规律的寻找，并不会受影响。

（4）早在2009年1月4日和5日的“量子信息与健康上海论坛上”和在这前后，我们发表的数篇关于大地震“拟大型强子对撞机”假说原理的报告，并不否认地壳板块断裂带的挤压、碰撞、错动、滑移等宏观机制，与火山爆发机制类似是客观存在的，也是起决定性的，但这与其微观机制及其概率也是有联系的──小尺度结构的无标度性实在，部分子的真空卡西米尔效应和能量量子隧道效应正是量子色动化学的增长极。量子隧道效应借来的“能量”也类似虚粒子，也是由不确定性原理和能量守恒原理产生的，而还回去也类似“衰变”产生的正反虚粒子对的湮灭。由此看来在量子色动化学中，这是把涉及部分子的卡西米效应和能量隧道效应，当作能量守恒原理和不确定性原理的一种模型化在使用。最基本的实验是真空卡西米尔效应，而真空卡西米尔效应最接近、最简约的数是“8”，这是一个“好质子数”。

（5）“好质子数”引出量子色动几何“游戏”，把焦克芳地壳元素核素衰变猜想推向了高潮──即地壳元素中分布最多的前9个元素的形成规律，是由于几十亿年以来地壳发生的无数次类似大地震和火山爆发的量子色动化学“微调”排列的。这可以通过量子色动几何层级图像的严格计算与分析，其规律之明显，可定性与定量地表达出来。如氧化反应是指具有像氧原子的非金属元素与像金属的元素的反应，在反应中，非金属元素将金属元素的电子夺走的过程叫做“氧化”。在化学中，“燃烧”是指较强烈的氧化反应，而不是没有“氧”就不叫氧化反应。所以如钠和氯的反应，就是化学中的氧化反应。而6个质子点的三角形连接的五面立体，只有一对平板是平行的。

这种量子色动化学能源器参加到原子核里的量子波动起伏“游戏”，会加强质子结构的量子卡西米尔力效应。由此这种几何结构，就有量子色动化学的内源性和外源性之分。同理，“硅”元素原子中14个质子，可以分别形成一个像碳基的五面立方体和一个像氧基的正立方体的质子组合体。另外不是有碳和氧才叫氧化反应的还有如氢和氯的反应，生成盐酸，这也叫氧化反应。而原子弹爆炸则是质能原理，不属于化学的电子移动过程，是不能用通俗的氧化燃烧解释的。

（6）从数学中推演出化学元素周期表，是从伽利略的“斜面”联系霍金的“界面”，再到卡西米尔的“平面”，采用数学描述：一个点构不成平面，两个点构成直线，三个点才可以构成一个三角形“平面”，六个点可构成一对平行的“平面”，才可联系“卡西米尔平板效应”。即把每个“点”看成化学元素原子核中的一个质子，六个点对应的是“碳元素”，已经进入元素周期表。

“6”也是“好质子数”吗？但与“8”比，是四个点构成一个四边形“平面”，“8”个点可构成一个立方体，是三对平行的“平面”；“8”点是8个质子，对应的是“氧元素”。“氧元素”比“碳元素”是地球上最活跃的化学元素，而且在所有的数目中，也只有“8”个点才可同时构成三对平行的平面。再说“量子起伏效应”的数学联系，与“卡西米尔平板效应”结合，打造出类似凝聚态弦物理数学0量子开合纠缠芯片，元素周期表是可以形成。即这里量子“0”，类似老子的“无中生有”数学如0+0=0；0+0+…+0=0。其次类似“量子纠缠”1+（-1）=0属于算术及代数运算原理有关的无穷多的自然数、实数、虚数、复数等正负数对的加法计算，涉及到量子起伏、真空起伏等类似卡西米尔效应收缩效应的检测，与霍金黑洞辐射，类似虚数能量效应现象的观察，是对应的。

（7）即“6”算“好质子数”，“8”是更好“好质子数”。

如此堆垒，扩张作各种几何体图形，并联系对应点的质子数的原子元素化学性质，作量子色动力学分析，称为量子色动几何。

由此来说量子色动化学，碳基量子色动几何图像比氧基量子色动几何图像虽然“经济”。但就是这个量子相互作用力，是最基本的实验可证实的力，地壳元素中分布最多的前9个元素，氧才占据了首位。这也是几十亿年以来，地壳发生的无数次大地震和火山爆发等中的这种力量的化学微调，氧才占据了首位的。

【6、结束语】

2023年11月9日微软公司创始人、慈善家比尔•盖茨，在其个人网站撰文，阐述了人工智能智能体在未来几年如何颠覆我们使用计算机的方式。作为类似“将一切用大语言模型作数学来处理”的宣言和总结，他在发表标题为《人工智能即将彻底改变你使用计算机的方式──并颠覆软件行业》的文章中说：

“人工智能智能体最令人兴奋的影响，是它们将使当今对大多数人来说过于昂贵的服务民主化。这就使一种未来变得更加清晰：人人都能使用自然语言开发软件、拥有多个专属私人助理，像浏览应用一样购买流行的私人助理。在计算行业，我们谈论平台──构建应用程序和服务的技术，智能体将是下一个平台──智能体不仅会改变每个人与计算机交互的方式，它们还将颠覆软件行业，带来自我们从键入命令到点击图标以来最大的计算革命”。

参考文献

[1]洛伊絲•帕什利，用AI与动物对话，林清翻译，环球科学，2023年11月号；

[2]凯文•哈特尼特，大语言模型如何学数学？陶兆巍翻译，环球科学，2023年6月号；

[3]乔治•马瑟，AI如何超越数据者，陶兆巍翻译，环球科学，2023年10月号；

[4]周耀旗，RNA语言模型也来了！2023年11月10日科学网个人博客专栏；

[5]李纯，现代“黑科技”助力传统中医，晚霞报（据中新网），2023年11月10日；

[6]王德奎，三旋理论初探，四川科学技术出版社，2002年5月；

[7]孔少峰、王德奎，求衡论──庞加莱猜想应用，四川科学技术出版社，2007年9月；

[8]王德奎、林艺彬、孙双喜，中医药多体自然叩问，独家出版社，2020年1月；

[9]王德奎，解读《时间简史》，天津古籍出版社，2003年9月；

[10]王德奎，自旋曲线过所有基本粒子质量点证明──复杂曲线拆分成易理解计算的基本曲线方法，金琅学术出版社，2023年4月；Academ Arena，October25, 2023;

[11]王德奎，环境能物联网与抗核武器系统，金琅学术出版社，2023年6月；Academ Arena，September 25, 2023；

[12]王德奎，中国与世界秘史，金琅学术出版社，2019年11月；

[13]王德奎，中国层子模型六十年分析回顾,金琅学术出版社，2022年11月；Academ Arena，April 25，2023；

[14]王德奎，聊天手机本质上是人工智能拓扑序──中文智能聊天手机模型数学初探宣言；金琅学术出版社，2023年9月；Academ Arena，September 25, 2023。

帐号		自动登录	找回密码
密码			免费注册

[纪实·新闻] 将一切用大语言模型作数学来处理