巴蜀网

 找回密码
 免费注册

QQ登录

只需一步,快速开始

同板块主题的 前一篇 同板块主题的 后一篇
开启左侧
 楼主: 王德奎|查看: 2026|回复: 49
[纪实·新闻

聊天手机本质上是人工智能拓扑序

 [复制链接]
21#
 楼主|王德奎 发表于: 2023-8-28 20:34:12|只看该作者
那时,分辨知识的能力和价值,甚至要比学习知识还重要。人类不完美,人类创造工具的目的,是克服人类的缺陷,延伸人类的能力,而不是单纯复制自身。历史从来如此。如果要单纯复制人类,最有效率的办法就是生育或“阶级斗争”。所以有人说教授社会知识论,主要关注,其一在个体的认识中,社会条件是否进入个体知识中。其二个体与群体认识活动所涉及的社会组织,即认识的努力与责任的优化分配与描述,包括认识的任务、责任与权益如何按社会关系,在认识主体中进行分配。其三集体知识的性质,知识是否为群体、社群或机构所拥有?是否这类集体的知识,仅仅是一些群体知识的总汇,或是包含了更多的东西?假如是这样,那么在何种方式上知识取决于社会关系吗?上述认识主体,进一步分离为甲方和乙方。前者如政府部门、公司,乃至个人。后者如高校、科学院、社科院和各种智库。
乙方专门从事某个或某些领域的研究,能提供相应的知识服务,既具备专业的知识和技术能力,又相当熟悉相关领域甲方的需求,能够向甲方提供可视化的分析,完成后者委托的事项。在很多场合,甲乙双方的角色可以互易、转变或翻转。如智库,既可以作为乙方承接政府或公司的委托,也可以作为甲方,向高校等机构或个人发包。
问题是个体(甲方)是否,以及凭什么信任乙方及其所提供的知识?ChatGPT诞生,成为前所未有的乙方。如果是用户,甲方何以信任和接受chatGPT及其所提供的知识?传统认识论,从普遍原理如“抽象规定”到“具体的再现”,由因果关系在逻辑上不容置疑地推出结论,因而意识形态和价值观预先就设定于回答之中,难以摆脱意识形态的纷争。chatGPT所做出的回答本身,在内容上不可避免带有这样或那样的意识形态。然而即使chatGPT按最大概率回答甲方的问题,去除了语境,避开了场景,打乱所有的“意义”、拆除一切好恶竖起的壁垒,消解引起纷争的源泉,但从人类知识库“塌缩”到问题域,加之chatGPT“自己”都不理解所给出的回答,故而非有意为之,在一定程度上可以避嫌,而为甲方所接受。
然而要是chatGPT真的“读懂”巨量的资料,按特定意识形态从中加以选择和排列组合,以及“理解”最终的文本,chatGPT还会得到眼下如此多跨国界、跨文化的接受和赞许吗?还会有如此迅猛的发展势头吗?如果是有心栽花花不开,无心插柳柳成荫,用户是否接受某种观点──这自然先在于其内容的真实性、逻辑性和意识形态的倾向性,不过由谁来讲,也关系重大。对某个主体的国家、机构、个人的好恶,会严重影响到对其之所言的接受程度。
如果在chatGPT回答的背后,不存在一个明确的主体。如谷歌说它刚开放公测的生成式AI Bard相当地大义灭亲──指责“谷歌收购竞争对手,施压网站使用其工具,对其广告交易进行限制”,但Bard并没有因为谷歌出品,就给予母公司特殊待遇;谷歌也没有干预Bard的看法。chatGPT,以及Bard等,是在默默地培育“自己”的信用,形成不同于人类及至人类之前所有生命的主体性。
这可信吗──巨无霸的知识库,既保障了回答之面面俱到,又淡化抹平了个别鲜明尖锐的言辞,大大扩展了适用面和接受度。chatGPT成为几乎无所不知、无所不能;ChatGPT不仅如乙方那样为甲方工作,而且帮助甲方站在巨人──不只是牛顿、爱因斯坦等寥若晨星的精英,而且是多得多的个人,乃至历史和当下人类的肩上,促使甲方的思路更为全面和条理化;chatGPT的回答,除了少数错误外,在大多数情况下让用户感到满意,甚至超出用户之所想,起到了实际效用,并且持续改进──chatGPT并不预设知识之普适性、地方性,还是个性,却在实际上既达到最大程度的普适性,可以与其他知识交流,又嵌入语境,满足地方性和个性所需。这可信吗?
张铮教授,是亚马逊云科技上海人工智能研究院的院长。他认为chatGPT成为各种不同观点、专家言论等背后,在一定程度上共同认可,具有某种权威性的文本和试金石,即使是一面客观的镜子,可以反观人类创造内容的能力和水准,在某种程度上为社会,进而为人类奠定共同和基础的知识结构,成为个人、机构,甚至国家和民族知识结构的源泉,但在目前,chatGPT还是存在有种种缺陷的。
因为即使今后进一步完善,作为甲方,作为甲方的集合,人类,有必要对其所提供的回答,要保持思考和质疑的立场和能力。因为ChatGPT所依赖的数据集之源,大致可分为六类:维基百科、书籍、期刊、Reddit 链接、Common Crawl 和其他数据集。但不用这几个数据集,也可以编出全新程序,不过这是过于专业的细节。
科学家的思想精华,远不是一个关乎存储和计算的问题──掺杂着个性、情感、直觉与动机──科学不是知识,科学是未知问题的探索,是获得未知的新知,是对现存认知的批判性反思。自1956年以来,人工智能已经发展了近70年,随着2022年底ChatGPT的“一夜爆红”,其发展进入“蜕变期”。但如何让人工智能成功“化蝶”,助力经济腾飞?2023年7月24日浦江基础科学发展论坛在上海开幕,丘成桐院士在会上说:“海内外数学家们希望能助力研究人工智能的‘基本原理’;搞清‘原理’以后,人工智能的应用范畴会大得多”。
但“基本原理”是啥?丘成桐院士没说。
有人说是逻辑──极富反思精神的古希腊人,不满足于自发的运用推理,而是把推理这种思维形式本身,作为认识对象展开研究,形成了逻辑学。推理主要分为演绎推理和合情推理两种。演绎推理,就是前提正确时,结论一定正确的推理;合情推理,是前提正确时,结论可能正确,也可能不正确的推理。至此演绎推理,到底是怎么回事?可以说人类已经彻底搞清楚了,而且可以让计算机去搞。
合情推理是非常重要的思维能力──积累经验也好,天资聪颖也好,很大程度上就是在说合情推理的能力──如果能够猜出答案,能够给出某些特殊情形下的讨论,能够适当添加一些条件后做出来,或者推出一点较弱的结果,这些都是有价值的,都是在提升合情推理的能力,应予以鼓励。那么智能中文聊天手机未来会统领全球类似英文ChatGPT及符号字母文字ChatGPT,是“合情推理”吗?
虽然目前“原理”还得不到承认,精英话语权不是掌握在英文ChatGPT一极手里,就是掌握在另一极符号字母文字ChatGPT手里,跟着使用外国人的用语,何有智能中文聊天手机的未来?
但假设运用中文,是科学研究很重要的环节,中文认字也要用拼音字母注音,但为啥形成14亿多人的中华民族比较接近于创新的起点,仍然不用注音、注义、编码、缩写功能的卦爻字母文字,而是中文汉字?也许科研人员在对中文GPT的提示问题设计中,如王选院士在chatGPT出现之前,能巧妙地部分解决,不是一个证明吗?
中文智慧的人工智能,大多来自5000多年中,是针对特定的场景应用进行训练,生成的模型难以迁移到其他应用,属于“小模型”范畴。整个过程不仅需要大量的手工调参,还需要给机器喂养海量的标注数据,这拉低了人工智能的研发效率,且成本较高。
不同于互联网平台,后者所起的主要是沟通和互联,而英文chatGPT起到如数学在科学中的作用,是一种基础和普适的横向性。可以说在一切按某种目的,需要收集、比较、转换和汇总当下知识、图像、音频和视频,进而加以分析、综合与展望的事项和领域,英文ChatGPT都可以大有作为。但智能中文聊天手机从互联网层面看,它的“连续与间断”,可以作为“理论与实践”信息的入口,与搜索引擎相结合,主人与它“聊天”,从文案办公方面看,中国人更是方便,可以与办公软件相结合,增强人的办公效率。
即使从人机交互角度看,体现的也是一种“演绎推理+合情推理”基于语言的自然交互方式,可以与元宇宙、数字人结合。这种统一,“智能中文聊天手机+chatGPT”大致由3层组成。底层是预训练模型的技术基础设施。中间层,即垂直化、定制化、场景化、个性化的模型和应用工具,实现在不同行业、垂直领域、功能场景的工业流水线式部署,同时兼具按需使用、高效经济的优势。应用层,面向C端用户的文字、图片、音视频等内容生成服务,最终和用户的需求无缝衔接起来实现产业落地。未来的数年到数十年内,智能中文聊天手机“接种”到chatGPT的行业、机构,各个细分的专业部门和用户,全球都可以将chatGPT整合到自己的产品和服务当中。
这包括生成应用和布局、搜索和数据分析、程序生成和分析、文本生成、内容创作,以及一般推理等领域,在“智能中文聊天手机+chatGPT”加持之后,所有相关领域大致将经历“科研、算力、基础架构、工程、数据、解决方案”这个循环,或其中的若干环节的快速迭代,凸显流动性和创新性,并形成高潮。此消彼长,是“智能中文聊天手机+chatGPT”=自由探索精神+科技公司+资本。它的技术爆炸+纵横交错=商业模式,巨量需求在短期甚至瞬间如海啸般涌入。
如果全球的人们源源不绝地挖掘“智能中文聊天手机+chatGPT”的更多技能,包括替写代码、作业、论文、演讲稿、活动策划、广告文案、电影剧本等各类文本,或是给予家装设计、编程调试、人生规划等建议,那么对AI深度学习会再快速发展,它的使用会类似神经网络的数学结构,可从海量数据集中提取模式。因为智能中文聊天手机、中文ChatGPT,和其它字母文字聊天机器人的最大区别,就在于它能真的做到跟主人有问有答,有来有回,并且能够根据主人的提问,即兴发挥,即兴创作。比较图灵机器人,应用场景包括智能客服、虚拟机器人、智能手表、智能车载和智能家居,其中虚拟机器人可接入微信、QQ等平台,搭建聊天机器人,与用户流畅交流。
这里如果图灵机器人提供自然的中文对话能力,精准的中文语义分析能力,准确判断用户意图,同时还具有丰富的上下文场景及强大的自我学习能力,是超过其它字母文字聊天机器人的。

22#
 楼主|王德奎 发表于: 2023-8-28 20:34:51|只看该作者
▲温馨提示:图片的宽度最好1800 像素,目前最佳显示是 900 像素,请勿小于 900 像素▲
如2022年11月美国人工智能公司OpenAI,推出的那款聊天机器人英文ChatGPT,能够通过学习和理解人类语言来进行对话,还能与聊天对象进行有逻辑的互动。但生成企业级聊天机器人与它是各不相同的,前者需要注意一些常见的模式、工作流和技术,尤其是为企业工作负荷提供服务的机器人;除了核心功能以外,还需要考虑到许多的设计因素。所以,有将聊天机器人划分为,机器人功能(“大脑”)和一组周边要求(“主体”)结构的。
大脑包括领域识别组件,其中包括机器人逻辑和机器学习功能。 其他组件不具备领域知识,用于解决 CI/CD、质量保证和安全等非功能性要求。用户首先使用机器人信道所提供的任何机制验证自己的身份,如使用 Azure 机器人服务创建机器人时,会自动配置网上聊天通道,用户可以在网页中使用此通道,直接与机器人交互。
用户的标识,用于提供基于角色的访问控制,以及提供个性化内容。用户消息是完成身份验证后,用户向机器人发送消息。机器人读取该消息,并将其路由到 LUIS 等自然语言理解服务。此步骤将获取意向,如用户想要做什么和实体,如用户对哪些内容感兴趣。然后机器人生成一个查询,该查询将传递给可提供信息的服务,机器人使用这些结果来构造响应。若要为给定的查询提供最佳结果,机器人可能需要多次往返调用这些远程服务。
如果最佳匹配解答的置信度评分较低,则响应可能是一个消除了歧义的问题,或者是机器人无法充分回复的确认。收到用户请求或者发送响应后,应该连同外部服务返回的性能指标和常规错误,将所有聊天操作记录到日志记录存储。以后在诊断问题和改善系统时,这些日志将很有用。即反馈,一项良好的做法,是收集用户反馈和满意度评分。反馈有助于解决自然语言理解的冷启动问题,并可以持续改善响应的准确度。机器人依赖于后端 ETL 过程,从原始数据中提取的信息和知识。然后,中间存储中的数据将在 Azure 搜索中编制索引以方便检索文档,载入 QnA Maker 以创建问答对,或载入自定义 Web 应用进行非结构化文本处理。
聊天机器人还能够充当小秘书的功能,如时间提醒,闹钟设定等都可以让聊天机器人帮助搞定。即聊天机器人无论是书面还是口头会话,都是一种可以模拟和处理人类会话的计算机程序,让人能够与数字设备交互,就像和真人交流一样。不同聊天机器人的复杂度,各不相同,简单如通过单行响应回答简单查询的基本程序,复杂则如数字助手,在收集和处理信息的过程中不断学习和进化,不断提高个性化水平。总之,聊天机器人是一种能够基于人工智能、自动规则、自然语言处理和机器学习等技术处理数据,响应各种各样的用户请求。
c、中文ChatGPT“知识+智能”民主化进展搜索
2023年4月19日举行的华为第20届全球分析师大会上,华为副董事长、轮值董事长、CFO孟晚舟表示,华为将在联接、计算、存储、云等方面保持投入,为客户提供极简架构、极高质量、极低成本、极优体验的“4极”数字基础设施,从而实现数字化转型的“4化”,即作业数字化,数字平台化,平台智能化,智能实战化。
围绕着数字化,华为在基础软件领域,已发布欧拉和鸿蒙操作系统、毕昇编译器、高斯数据库、昇思AI框架等,企业网络接入、家庭宽带接入、个人无线接入将迎来万兆联接的时代;通用算力将增长10倍、人工智能算力将增长500倍。那么是否百度的文心一言就不行,现在全指望华为的盘古吗?不是的,国内从业AI者,是合作的。
被AI技术革新撕开了一道裂痕,在办公软件、云计算、视频游戏等市场,不可一世的谷歌、微软,即使占有举足轻重的地位,意欲与苹果等比肩而立,但起点都是不同的。如谷歌崛起于互联网时代,以搜索引擎定义了互联网信息分发的基本路径,并以邮箱、视频、地图等产品覆盖网上冲浪的边边角角。而在移动互联网兴起后,谷歌又以安卓系统成为最大赢家,其竞争力围绕“移动+信息”展开。
阿尔法狗击败柯洁即是谷歌AI技术积淀的惊鸿一瞥,谷歌却因为Bard的拙劣表现股价跳水,创新力遭遇空前质疑。与搜索引擎和手机操作系统领域的对手相比,“OpenAI+微软”的组合要强大太多。如今,三星已经显露出不惜代价投奔微软阵营的迹象。无线回传技术是移动回传网络中连接基站与核心网设备的关键技术,在基站“高度致密化”的5G/6G通信时代,传统基于光纤的承载网传输将面临成本高、部署周期长、灵活性差等问题,无线回传技术将逐渐占据主导地位。太赫兹通信作为新型频谱技术,可提供更大传输带宽,满足更高速率的传输需求,逐渐成为6G通信关键技术之一。
这些“知识+智能”的创造与什么相关?2023年4月21日《科技日报》记者叶青、龙跃梅,发表的《人工智能能否超越人脑?这场会议掀起一场“脑风暴”》一文报道:在广东东莞松山湖科学城举行的会议上,中科院脑科学与智能技术卓越创新中心学术主任蒲慕明院士说:“人脑最大的特点是高效,人脑只需30瓦的能量,就可以运作起来,这种效率是同规模人工智能难以超越的”。
蒲慕明院士认为,人工智能下一步发展的重要突破点,是未来的类脑算法,能够超越深度学习的算法。目前ChatGPT还没有突破此问题,因为算力仍没有突破。复旦大学脑科学研究院学术委员会主任杨雄里院士也认为:“人工智能可以借鉴大脑的运行方式,但反过来,大脑是否也可以借鉴人工智能运行的原理和方法?”
众所周知,脑科学被认为是人类科学最后的前沿,是当下全球科技竞争的重要焦点。智能中文聊天手机的目标,正是在谋划打造类脑与人工智能技术创新及产业新高地。聊天手机的底气在哪里?人工智能开发机构OpenAI的首席执行官山姆•奥特曼教授不是说:“ChatGPT的研究策略──巨型AI模型模式已经结束,新的进步不会来自于让模型变得更大,我认为我们正处于巨型模型时代的末尾”。Cohere的联合创始人尼克•弗罗斯特说:“奥特曼的想法听起来是对的”。
新的AI模型设计或架构未来的进步,来自聊天手机。在ChatGPT首次亮相后,技术专家推测GPT-4出现时将成为规模和复杂性令人眩晕的典范。因为奥特曼曾被问及训练GPT-4是否花费了1亿美元?
他回答说:“不止于此”。奥特曼的说法表明,GPT-4可能是OpenAI“使模型更大并为其提供更多数据”战略中的最后一个重大进展。谷歌及其母公司Alphabet的首席执行官桑达尔•皮查伊教授也说:“我一直认为人工智能是人类正在研究的最深刻的技术,比火、电或我们过去所做的任何事情都要深刻。社会需要适应新技术,各行各业或许都会受到影响,作家、会计师、建筑师,以及软件工程师在内的‘知识工作者’或将被人工智能颠覆。虚假信息、假新闻和图像方面有很大问题,生成式人工智能的风险之一是深度伪造视频。在这些视频中,一个人的行为可能会被伪造,例如发布从未说过的某种言论”。
皮查伊教授还说:“制作这些深度伪造视频的人,必须承担后果。任何与人工智能合作过的人,都会意识到这是如此不同、如此深刻的东西,以至于我们需要社会法规来思考如何适应”。所以,谷歌开始部署自己的聊天机器人Bard的内置安全过滤器,以抵御恶意用户的威胁。比如检测计算机生成的看似真实的图像。
未来可能会分为用AI的媒体和不用AI的媒体,而AI可能会超越互联网所能带来的影响。由于媒体高度关注甚至放大生成式人工智能带来的影响,也许对AI接管人类工作的担忧,可能被夸大了。因为机器人不仅没有以大多数人认为的速度取代人类,而且有些人还错误地理解了自动化工具的接管速度。与此同时,并非所有人都被人工智能削弱了优势。以音乐为例,AI工具可以使音乐制作民主化,这对业余创作者来说也是一种恩惠。人们可能会使用AI来娱乐,而不是与训练有素的音乐专业人士竞争,但他们的作品可能仍会在市场上蔓延。
智能中文聊天手机使“聊天”制作民主化,也是如此──人类和机器人的结合将永远存在,比如很多年前,可能需要我们在农田里务农,工业时代变成流水线女工,到未来可能就变成为AI工作的工人。变化的只是工作形式,我们始终都会有工作。当然在这个过程中还有一部分人,会因没有继续学习或没有继续使用新工具,而被淘汰。
但中文聊天手机“知识+智能”民主化进展,类似创意的写作,总是会被赋予作家极具个性化的特征的。即只有具备了作家个性化的特征,才能使创意写作具有独特价值。人工智能生产的产品,若是千篇一律,对人类而言就毫无价值可言。随着中文聊天手机“知识+智能”民主化进展的出现,人工智能已经完全可以在几分钟内生成内容完整的高质量作品。人们用其进行创意写作几乎成为不可避免的趋势,甚至有人称之为新的创作方法。
中文聊天手机“知识+智能”民主化进展,可以在创意写作方面发挥创意;可以利用丰富的知识和对语言的理解生成富有创意和引人入胜的文本;可以做为写作者提供提示或建议,让写作者的创意源源不断;可以生成各种体裁和风格的原创作品,为写作提供灵感;可以审阅作品并提出修改建议,提高写作流畅性、语法和可读性;可以对写作者的工作提供建设性的批评和改进建议;可以针对特定主题创作原创作品,并将其作为写作者创作作品的起点。
中文聊天手机“知识+智能”民主化进展具有了交互性,即使尚没有独立思考和创造的能力──创意写作,通常要跳出传统与固有框架,探索非常规的想法,需要丰富多彩的想象力;创意写作,需要作者将自己独特的创造力和想象力带到这个过程中,人类独有的风格或语气是机器人无法获取的。它根据统计模式生成的文本很难有完整、具有辨识性的个人风格或声音。它不具备体验情感的能力,也没有个人体验因此也就无法创建真正原创的内容。然而即使尚有以上局限性,还有如常见的包括单词重复、结构简单和信息过时的错误与局限,使进行创意写作仍有不同看法,但它仍可以成为专业人士的有用工具,帮助并启发人们产生新想法并探索新的写作风格。它作为人工智能语言模型,可以根据提示和输入生成文本,这不好吗?

部分图片、文章来源于网络,版权归原作者所有;如有侵权,请联系(见页底)删除
23#
 楼主|王德奎 发表于: 2023-8-28 20:35:45|只看该作者
7、科技圈内外的理论与实践、连续与间断
全国政协委员、南京大学高抒教授说:“如果把科学院的正式成员不能解决的难题,算为难题,拿出来竞赛,如果能解决,国家所花的成本最低,并且能带动一大片”。
高抒教授是把以前大家说的“民科”改称“科技圈外”,相反,把以前大家说的“官科”改称“科技圈内”,这很明智。高抒教授想的“高大上”是,他说:“中国是14亿人口的大国,应该在基础理论和工程实践两个领域里面,都有所作为,这才符合大国的国际地位”。
他解释说:基础理论,我国的科技政策,已只有圈内收购政策,没有圈外收购政策。世界上,科技圈内收购政策,和圈外收购政策结合的土壤,培植了数以千计的大科学家。但在我国,谁能申请到国家攻关重点项目或课题?圈内人!科举制是我国在世界上最早创立的类似科技圈外收购政策,以后世界各科技人力资源大国,都沿袭此道才成为科技人力资源大国,我国现代也如此。说的多好啊!
高抒教授还说:“顶尖成果稀缺的问题,应该一分为二。在工程技术领域,我国还是有一些顶尖成果:从前国家很困难的时候,有两弹一星;现在则有登月、高速铁路、三峡工程。然而,在基础科学领域的成果,就相对少了,这主要表现为大科学家人数太少”。他认为:什么是大科学家?应该体现在自己的研究领域里,能够建立新理论、发现新方法上。他介绍说:“为了培养出大科学家,要有一定数量的小科学家,做大科学家做的事情。换言之,要有重要的科研课题,每个人都要发现新方法,提出新概念,对科学事业有重要贡献”。
中科院工程序列任职资格评审委员会主任谢耘博士,观察者网采访他时,类似的话题他还补充地说:“信息技术的发展,让影响他人的意识这件事变得更加高效,甚至更加隐蔽。机器学习或者机器搜索出来的结果,不是中立的,它是被人训练出来的,它有人的‘外意识’的本质。我觉得这一次,引起大众的强烈反应就在于,大家发现机器确实能和你说话;给大众的震撼,更多是一种感性体验;带来的治理‘生成式人工智能’,相当于要管人的思想”。
观察者网记者问他:既然ChatGPT是一个意识的工具,我们是不是需要担心来自少数人的意识,尤其是可能来自境外的意识,通过信息技术的赋能,来影响多数人的思维和行为的方式?
谢耘博士回答的是:借助网络,可以轻易实现复制、传播等等,在一件事情规模有限的时候,社会对它进行管理是比较容易的。如果规模巨大之后,管理是非常困难的。但本土相关企业要守规矩,境外的公司的相关产品或服务如果要进来,也要守规矩。
因为意识性工具和物质性工具不一样,物质性工具的生产者,一般生产一个静态的东西,只要产品符合标准,就完成了主体责任。而意识性工具提供者的产品很难界定,它是一个“活的”东西,所以必须持续强调技术提供者的责任。另外,如果针对技术使用者,可能执法成本太高,因为那是面对不特定的多数人,而技术提供者由于受物质条件限制,必然是少数“中心化”的大型企业,拥有庞大的资产和能力,也依赖其他组织的能源和资源供给,把它们作为治理抓手,也等于抓住了“物质世界”这个锚点。
这里的“理论与实践,连续与间断”,信息网络技术是一种类似“连续”工具,今天的智能手机到ChatGPT,它可以无线连接,实际是连续的,类似“意识性工具”。智能中文聊天手机,虽也是少数“中心化”的大型企业生产的,预先带有工具提供者的意识形态,要它变为类似“物质性工具”,就需要与无线连接网络断网。这样主人买走它后,主要是跟主人聊天接受大模型训练,跟人出生长大之后,跟外界环境是“连续与间断”。只要“脑机接口”技术没成熟,或没有做“脑机接口”技术手术,成为“半脑半机”的混合人,某种意义上人仍然类似“物质性工具”,如人出生。建立国家,成立组织,本质是把“物质性工具”型的人,转变或翻转为“意识性工具”型的人。
但这与“人机融合智能和人机混合智能”两个概念不同,而且尽管“人机融合智能和人机混合智能”有些相似,但还是有区别的。
人机融合智能,是指将人类智能和机器智能融合在一起,形成一种全新的智能体系,实现人类与机器之间的高度互动和协同。
这种融合往往需要在机器上实现类似于人类思维的能力,以实现人机之间的无缝融合。人机混合智能,则是指将人类和机器的智能进行有机结合,使得机器能够协助人类完成某些任务。
这种混合,往往是在机器的智能上进行扩展和增强,以使其能够更好地适应人类需求。从上可以看出,人机融合智能更加强调人类和机器的一体化,而人机混合智能更加强调机器对人类的协助和辅助。
人类的常识与机器常识,有很大的不同。如对世界的理解不同:人类的常识,是基于对世界的深刻理解。而机器常识,则是基于对数据和规则的处理。机器可以识别和处理大量的数据和信息,但缺乏对人类行为和社会文化的深刻理解。总之,机器常识主要基于数据和算法,而人类的常识则基于长期的生活经验和社交互动。这有4种:
(1)人机交互:人类可以通过与机器进行交互,向机器提供更多的信息和指示,从而帮助机器更准确地感知周围的态势。
(2)机器学习:机器可以通过学习人类的态势感知方式和经验,从而优化算法和提高感知准确性。
(3)信息融合:将人类和机器的态势感知结果进行融合,可以得到更全面和准确的态势信息,从而更好地应对复杂环境和任务。
(4)分工合作:人类和机器可以根据各自的优势和特点,在态势感知任务中进行分工合作,从而更高效地完成任务。
人类作为“物质性工具”有多模态,这指的是人类能够同时利用多种感官,如视觉、听觉、触觉、嗅觉等,对外部世界进行感知和理解。这种“连续与间断”是人类的情感识别,只能根据语言表达者的语言内容、语调、面部表情、身体语言等多种因素,进行判断和推理。
同时还要考虑到语言使用者的文化背景、个性特征,以及人际关系等方面的因素。人类的情感识别,能够处理复杂的情感表达,如隐喻、讽刺、反讽等。同时还能够感知到,语言表达者的情绪状态和情感变化。而机器的情感识别,则是基于自然语言处理技术和机器学习算法,通过对语言内容、语调、语境等多个方面,进行分析和处理,提取情感信息。机器的情感识别,需要大量的数据和算法支持,能够进行情感分类、情感分析等任务,但在处理复杂的情感表达、识别情感变化等方面还存在一定的困难。
总之,人类的情感识别,在处理复杂情感信息方面有优势。而机器的情感识别,则在处理大规模数据和进行自动化处理方面有优势。
有人利用现代科技手段,编造虚假信息,并散布在互联网上,被大量传播浏览,其行为已涉嫌寻衅滋事罪。当AI有能力批量生产伪科学,谣言,如何破?所以,这比过去更需要靠谱的科学内容。
未来靠谱的内容生产者,一定会受到更多追捧。如能生产智能中文聊天手机者,一定会比生产智能手机、英文ChatGPT者更棒。
因为生产智能中文聊天手机,不仅要把靠谱的散落在专业资料里的内容进行通俗化处理并汇总,变成一个准确、完备、能够与时俱进的半专业数据库。而且“搬运”已经存在的真正打动人心的半专业数据库,不仅需要内容创新,还需要形式创新,如将字母或拼音文字变为中文汉字和它的普通话或方言读音,这些AI并不擅长。
AI并非是天生的“机器智能”。如百度眼下正在利用百度“文心一言”语言模型,研究互动式AI知识图谱,利用AI创建针对用户的普通话或方言状况和相关科学依据,让用户更感满意。这类似需要把以往一次性端上的“科普大餐”,变成每日更新的“科普快餐”。
心结难解,因为我们和人类命运共同体彼此期待太多──我们希望生产智能中文聊天手机者,能驾驭AI,让它成为全球人类命运共同体各种语言的统领和传播助手。
8、社会政治内的理论与实践、连续与间断
2023年5月9日“文化纵横”网发的《chatgpt被叫停一个月后,清华教授首次揭开颠覆性的政治真相》,是转发清华大学任剑涛教授在《新视野》2023年第2期,原题为《放飞想象:人类增强与精英政治的黄昏》的文章。因这类研讨似乎在揭示chatgpt在开辟社会政治内“理论与实践、连续与间断”的新时代,特作介绍。
任剑涛教授说:“从古至今,人类社会的政治都属于精英政治。技术对人类社会最大的颠覆,在于增强人的平等性,拉平人与人之间的差异,打破‘精英’和‘大众’的壁垒,削弱精英政治的基础,而这将对社会政治产生根本影响”。他说理由是:chatgpt技术突破的全方位挑战,建立在人的天赋异禀与后天机遇基础上的精英政治,或许将面对人的自然禀赋与后天差异的技术敉平,会让人类政治步入一个全新的境地。如超人类主义是一种对超越现实人类的未来进行阐发的思想,包括永生、人机融合、太空殖民、人工增强智能等理念,即:
1)发现和发明不同,承认与奖励方式也应该有所区别。如屠呦呦教授的发现是0到1的突破,获得诺贝尔奖是实至名归没问题。
2)在应用层面,荣誉与奖励该如何分配呢?这也是产生争议的主要焦点所在。任剑涛教授说他倾向于把这部分的功能,完全交给市场来处理,如chatGPT的承认与奖励,就不应该由政府层面来处理,而应该交由市场来处理。在这方面我国做的不是很好,科学与技术领域的所有奖励与承认都是由政府掌控,这是低效的,也是不合理的。
3)成就与贡献的区分,成就是个人所达到的高度,与区域无关;而贡献,是个体对于国家/机构的一种产出。

24#
 楼主|王德奎 发表于: 2023-8-28 20:37:51|只看该作者
这类研讨似乎在2023年7月26日以前更为尖锐,应不应该结束?因为在国家使用语言及语言工具来自哪国都涉及社会政治,争端各说各有理。而把2023年7月26日作为一个“间断”点,就有这类普遍特色──如2023年7月26日上海“观察者”网记者范维,发表《被俄外长拉夫罗夫批评“不民主”,吉尔吉斯斯坦总统为国家语言法辩护》一文报道:7月19日俄罗斯外长拉夫罗夫,就吉尔吉斯斯坦通过国家语言法、规定在官方活动中使用吉尔吉斯语一事,发表评论称“这并不民主”,并表示俄方已对此多次警告。
吉总统扎帕罗夫24日的回应是:“该法无意歧视俄语,而是旨在发展和推广吉尔吉斯语”。受历史和经济因素,俄语在中亚国家享有较高的地位。但是近年来,吉尔吉斯斯坦等国在以各种形式推动本土国家语言的流行。吉尔吉斯语作为吉国的国家语言,是吉国国家地位的主要标志之一,也是吉国人民的身份属性。
为此,研讨类似俄外长拉夫罗夫为争“民主”的原因,如2023年6月30日“观察者”网发表,复旦大学马哲教授的文章《托卡马克之冠:瓦格纳兵变背后,是俄罗斯未能建立起有效的政治协商机制》中,类似说:“俄罗斯的基本政治架构,实际上是一个君合国”。
马哲教授解释:这个概念,对长期生活在大一统政体下的中国人来说比较陌生。所谓“君合国”,是指一堆相互独立的主权实体,由于其君主恰好是同一个人,而基于这种关系合并为一个共同体“搭伙过日子”。人类历史上有不少政治实体,是以君合国这种形式存在的。如铁托一死,就人亡政息的南斯拉夫,或是现在依然存在的英联邦,这些都是君合国这一特殊形式政治实体的典型例子。俄国历史上长期以来便是非常典型的君合国;历史上的俄国实际上是一大堆主权实体的总和,这种特殊政治结构在运行过程中,深刻塑造了俄国的社会形态,导致其政治文化形成了根深蒂固的政治协商传统。
与西方国家常常将俄国视为专制国家的“一言堂”刻板印象大为不同,俄国其实有悠久的政治协商传统。俄罗斯人特别喜欢开会议事,以至于这种方式被视为政治合法性的关键来源。君合国的一大特点是内部不同的主权实体和山头派系间的利益关系错综复杂,甚至相互矛盾,稍有不慎就会导致内部关系破裂。正是因为这一特质,导致看似专制的沙皇,在大多数时期的主要工作是“和稀泥”,其实际职能是为国内各大山头派系和利益团体提供一个协商沟通的平台,尽可能一碗水端平,并在各方纠纷争执不下的时候,以君主权力来做出决策并一锤定音。一战末期,沙俄崩溃,沙皇退位,也就意味着由沙皇承担的协商平台失灵,君合国内部利益各不相同、甚至互相冲突的各大山头失去了由沙皇和稀泥来掩盖矛盾的办法。
苏联的建立,可以视为布尔什维克通过联盟这种特殊形式把这一解体进程暂时冻结了,并且通过党组织内部的工作关系,承担起本来由沙皇承担的山头派系间的协商职能。某种意义上,苏共接手了沙皇的宝座,君合国又再度运转了起来。到了戈尔巴乔夫时期反而认为只要绕过这套机制,直接把最高权力交给社会,一切就都能解决了。
结果可想而知,苏共承担的沟通协商职能被架空,各大山头派系的利益关系再也无法协调,长期被掩盖的矛盾全面激化,本已被冻结的君合国解体进程再次开启……后来的车臣叛乱、乌克兰危机无非是这一进程的延续而已。上述缘由恐怕是苏联解体的关键原因,本质是沙俄解体的延续。苏联的存在,只是将原本的进程暂停了七十年,一旦协商职能失灵,解体进程再度开启。
我们国内对于苏联解体的理解,有时候过于意识形态化,很多一知半解的人喜欢动辄诉诸于“理想信念丧失”这类思想层面的理由,但我们也需记住一点,世界是物质的,没有任何国家能仅仅依靠理想信念就长期维持存在,讨论问题时搞唯意志论并不一定行得通。瓦格纳兵变,实际上是自1917年3月12日沙皇退位之后,因缺乏一套稳固有效的政治协商机制而导致内部矛盾无法及时纾解,最终长期积压后突然爆发的这一情况的又一例证。但俄罗斯想探索出一条适合当下国情的、稳固有效的政治协商机制的道路,目前依然遥遥无期。
一战后期沙俄解体,俄国历经共和国、苏联、俄联邦三个时期,但始终未能建立起一套行之有效的内部沟通协商机制,这甚至可以说是苏联解体的根本原因之一。但是用“君合国”这个概念来解释瓦格纳政变的原因,认为瓦格纳政变仅仅只是不同政治势力提出诉求就完全错了。“君合国”中国也存在过,解放前的国民政府本质上就是一个“君合国”,阎锡山,李宗仁,冯玉祥可以认为是不同从属帮国的主体。瓦格纳造反,根本原因来自于俄国集权政治的退化。
任何制度,无论是选举还是集权。作为制度本身必须有一个具备足够合法性的制度框架。历史上看,俄国就是个专制国家,无论是沙俄,还是苏联,都有足够合法性的制度。但是目前的俄罗斯联邦连基本的合法制度框架都没有,表面上是选举制度,实质上是对国家的强人控制。类似于委员长之于民国,萨达姆之于伊拉克。对组织进行治理,不是依靠各种规章制度,而是来自于领袖的个人好恶,新疏远近,所以才会出现独立于军队之外的独立武装。
该文后的跟帖还有说:复旦的那位马哲老师,他说贵族从未在欧美日等国的政治结构中消失过,而与之不同的中国,则有2000多年的贵族分封制──郡县制斗争,这种斗争在宋王朝时期在汉族内部决出了胜负,郡县制为主,贵族制度最多是辅助,就算是清王朝也不例外。在这种组织模式公然存在的国家,搞民主完全就是笑话,比如欧美日。记者范维文后的跟帖有说:沙俄是帝国主义,列宁在世时是真正的共产主义者和理想主义者,主动提出要解除和中国满清订立的不平等条约,主张归还沙俄侵占的中国土地。但是两次遇刺终于过早辞世,接受的斯大林,不可否认为苏联的强大做出了贡献,
但他是格鲁吉亚人──斯大林怂恿蒙古独立,对自己家乡的格鲁吉亚人也不好,怀疑心重,搞肃反扩大化,把许多为苏维埃做出贡献的领导人都杀害了。至于到了苏联解体,大航海以来沙俄与大不列颠的扩张史,与大不列颠相比,沙俄那是吃下去不吐骨头──俄罗斯大概觉得有说俄语的地方,就应该是俄罗斯的领土,起码有权独立,归在俄势力范围内──乌东地区,南奥塞梯和阿布哈兹地区争执在先,经过公投先后独立,各独立地区申请加入俄联邦,就如同克里米亚,经过俄议会通过,完成法律程序,正式成为俄联邦领土。俄罗斯人和俄罗斯文化,本来就应该退回乌拉尔山以西,但外东北的划界已经法定实事,难道可以去向满清讨要或是自己发兵夺回?
潘光教授,是上海社科院研究员,联合国文明联盟大使。2023年7月6日他在“观察者”网发的文章中说:“针对俄罗斯内部问题,说实话即使有,也是中央的决策。但我们能够清楚看到的是,目前国内学术界、舆论圈的两派意见已经很明显,一派是呼吁尽快跟俄罗斯拉开距离,另一派则是继续坚决支持俄罗斯”。他还说:“其实这种观点分歧,从俄乌战争爆发那一刻起,就非常激烈,甚至包括前外交人员、知名学者等,都公开批评俄罗斯的军事行动。我记得当时去参加活动时,碰到美国驻沪总领事,对方直接问我怎么看这些不同意见。我说,这些说法代表了中国国内不同的观点。但在我们国内占主导意见的是维护中俄友好,劝和促谈;不过即使持有这种观点的一派也已明确表示,不支持入俄公投,不支持吞并克里米亚”。
潘光教授说的,联系chatgpt在开辟社会政治内“理论与实践、连续与间断”的新时代,实际当前AI发展虽然很快,只要它无法回答“连续与间断”两个问题,任何研究工作就无法被取代。因为社会政治内的学术讨论,作见面的自然交流聊天,或因兴趣的交流聊天,不是做生意场上钱财交易,而更像是摆“活思想”,找“柳暗花明”式的解困。这与今天火爆说的英文“聊天机器人”(ChatGPT)、OpenAI(开放人工智能)本质有所不同,这会更想像未来造的智能中文“聊天手机”式的人与人之间的聊天相似。
2023年7月2日观察者网报道第十一届世界和平论坛在北京开幕,类似摆“活思想”,找“柳暗花明”式的解困,其中有一个范例,是金砖国家新开发银行行长、巴西前总统迪尔玛•罗塞夫,在第一场大会上分享她关于“构建中的国际秩序”时的类似“聊天”。她说:一些源于某一个国家经验的政治模式,一度被提升为世界的“唯一标准”,并被强制推行。一旦不接受这一强加的价值观,就会受到相应的惩罚,或是被施以战争、政变、制裁的措施。“人类文明的丰富和多样性就这样被简单地抛弃,不同民族所追求不同发展道路的模式也由此被忽视”。她说的现象,对照美国搞的贸易战、科技战、生物战都已失去抓手,印度马上跑过来送温暖,为啥?
有人说,在世界500强企业中,30%管理者是印裔。在美国的科技行业,亚裔员工占比超过30%,主要技术岗位管理者占比约15%,其中绝大部分是印裔。而华裔员工,主要在基层各类技术岗位,鲜有能晋升到管理层的。除了谷歌与微软,摩托罗拉、百事可乐、诺基亚、软银、Adobe、SanDisk、联合利华、万事达卡、标准普尔……这些在人们心目中轰雷贯耳的国际巨头,其CEO级别的高管位置,居然都被印度人拿下。全球最大的电信运营商沃达丰集团前首席执行官阿伦·萨林也是印度人。他在硅谷见过很多投资标的公司,见面后发现印度人是创始人的比例,多到让人快要发疯的程度。
如硅谷新创企业CEO超过25%为印裔,华裔则寥寥无几。谷歌董事会的13位高层领导中,居然有4位是印度裔。早在2005年发布的一份研究报告就显示,硅谷三分之一的工程师是印度裔,高科技公司里7%的CEO也都来自印度,中高层管理者中印度人的比例更高。今天的比例更是比10年前高得多。相比之下,中国人在美国高科技企业中的能获得管理岗位的不仅凤毛麟角,而且还在被全线排斥。能去美国的很多都是从中国顶尖学府(清华、北大、中科大等等211、985名校)毕业的高材生,最终在美国却只能当纯打工角色的工程师、架构师。原来硅谷被称为IC的天下,I指Indian,C指Chinese。但现在,硅谷的别名已经叫“印度谷”。
其实这没有奇怪的,今天被“新殖民”与“旧殖民”现象的不同,过去霸权帝国搞“旧殖民”,你看它的“朋友”类似你的“敌人”;今天搞“新殖民”,你很难知道你是否被“新殖民”了。因为ChatGPT来临的时代,也许搞“新殖民”能成功的高智商,是在被它派对的“朋友”之间,搞成像“敌人”,才是你无法脱身的。打破这种怪圈也要智商,例如华为麒麟芯片(手机芯片),是买的ARM V8 IP内核授权,不是自己指令集,说白了在指令集方面,还是受制于ARM。但这并不是被“新殖民”。有人说:华为麒麟芯片,因为被它国制裁,台积电不为它代工,所以基本上就生产不出来了。而龙芯和华为走的不是一条路,华为商业性质更浓一些,买的ARM IP 做的芯片。

部分图片、文章来源于网络,版权归原作者所有;如有侵权,请联系(见页底)删除
25#
 楼主|王德奎 发表于: 2023-8-28 20:38:32|只看该作者
龙芯的代码,可以考虑中文化。龙芯中科董事长胡伟武教授表示,龙芯基于自主指令系统的基础软件生态基本建成,基于自主IP核CPU性能达到市场主流产品水平,基于自主工艺可以基本满足自主CPU生产要求。龙芯从指令集loongArch 全盘是自己设计,自主控制的。生态也是loongArch自主可控的生态。生产也是面向中国自主可控的芯片制造。这套产业链体系,国外没法卡。
当然这个体系,也是非常庞大复杂,非常难。但是这种庞大复杂的生态体系,制造体系一旦成熟起来,会产生很多高端工作岗位,中国也就基本跨过了中等收入陷阱。LoongArch 是龙芯公司设计的一种 CPU 指令集架构。“LoongArch架构(指令集),是龙芯中科自主研发的CPU指令集。“CPU也叫做中央处理器,是一台计算机的运算核心和控制核心,是计算机内的电子电路,通过执行指定的基本算术、逻辑、控制和输入、输出操作来执行计算机程序的指令。
即CPU相当于电脑的心脏;代码中文化,写程序太费事。不过龙芯的各种技术资料确实是中文化的,官网上就有,确实有利于中国人学习。但怕被“新殖民”或“旧殖民”,你就干脆全盘否定,直接推翻洋人的发明,如交流电,电磁波,发动机,卫星,等着你重新发明一遍,在继续推动发展就不算被“新殖民”或“旧殖民”了吗?
华为自己说了,鸿蒙系统不对外;第二,OH系统并不成熟,且不兼容安卓。一个半导体产业,有助于我们跨越中等收入阶段,但只凭半导体产业,没办法让我们跨越中等收入阶段。即使是达到了世界先进水平的半导体产业,也没有那么大的推动力。要真正实现发展阶段的跨越,那需要全产业链升级,涉及方方面面,半导体只是其中之一。龙芯指令集只是对RISC-V的微调,基本就是抄的。是不是微调不要紧,关键是能否在法律上,承认为是自主知识产权。
如果法律上认可,对将来开发新产品,进行市场销售非常有利。鸿蒙理论上,也可以这样在龙芯上运行:指令集是在硬件上的,各种操作系统,都可以为硬件开发支持版本。但只是理论上的可行,现实涉及到巨大的成本,所以除了开源的linux会广泛提供支持外,其他操作系统,基本不会支持更多硬件的。如微软就和intel结盟,微软的操作系统为intel的硬件提供支持。后来微软试图为arm类硬件提供支持,但成本太高了,最终只是浅尝辄止成了鸡肋。
华为的盘古大模型3.0,包括“5+N+X”三层架构:L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。盘古3.0为客户提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,都可以供客户和伙伴企业直接调用。L1层是N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型。
L2层为客户提供了更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。2023年7月7日在上海的第六届世界人工智能大会,大模型是绝对的关键词,而正当各大厂商的大模型在聊天、画画、作诗方面“争奇斗艳”时,华为却推出了一个“不作诗”的大模型──“盘古大模型”不作诗,也没有时间作诗,因为它要深入到各行各业中去,让AI赋予各行各业价值。华为不上市,所以不用为讨好和吸引投资人开发一些AI琴棋书画技能。这也能联系金砖新开发银行行长罗塞夫的“聊天”。
即随着新兴经济体资本市场以及全球贸易交易份额不断增长,充分预示着美元霸权地位将进一步下降,全世界货币体系将变得更加多元化,这一过程中发展中国家的货币,将显得尤为重要。虽然霸权主义国家采取了遏制打压新兴经济体的一系列政策,但是不可能会一直抑制新兴经济体的崛起。在此过程中,智能中文聊天手机普及就类似发展中国家的货币,也指引社会政治内的理论与实践、连续与间断。
9、中文和英文纠缠的理论与实践、连续与间断
a、开辟中文和英文纠缠创新的第二战场
今后如果智能中文聊天手机普及,它是人工智能语音技术在软件和硬件上,都是超英文和英语世界的重大突破,又如何呢?
中文和汉语,英文和英语,作为一种纯粹、客观的自然、社会现象符号的记录、交流和保存的工具,本身是没有阶级性和意识形态的。但从几万年到几千来人类社会、民族、国家、制度、宗教、文化、经济、科技、社团、党政、战争等的分化,它们是文字和语言在全世界分为的两大群体,类似东西方有别。又因学文化,比自身自然掌握的会母语难,如中文是象形方块文字,看文字读不出语音,也还需要类似拼音去注音。英文是注音文字,读出英文,大体就明白英语的意思。
所以在华人群体中,历来不懂中文能自然说汉语的人,比认中文又能说汉语的人多得多。在英语世界,这种现象要少一些,因为懂英语学英文比学中文容易些。如为啥美国驻俄罗斯大使会说俄语,美国驻中国大使凭啥不说中文,就因中文起点比字母符号拼音文字高。
电子科技大学黄健教授2015年6月24日在“科学网”客人博客专栏,发表的《为科学交流的中文化与多元化尝试点赞》一文中说:“虽然对母语充满感情,但面对科学世界里英语‘千秋万代,一统江湖’的趋势,我似乎也只能默默地顺其自然,甚至随其流而扬其波……我从不认为中文只适合写诗或哲学研究,我也不认为英文或任何一门语言是天生的科学语言。一切靠实力说话。期待中文比肩英语,成为最重要的国际语言,无论在经济文化还是科学研究领域”。
像黄健教授这样的有志之士的中国人很多,特别是中科院院士、著名海洋地质学家、同济大学教授汪品先。2023年7月15日在上海市科协、市教委主办的“大师课堂”活动第三场讲座,主题为《现代科学与传统文化》,他讲如何在世界科学舞台打出“中国牌”?现代科学和中国传统文化存在怎样的矛盾?汪院士说:“语言和货币一样也有‘币值’,随着其使用价值而升降。在科学领域,如果能让汉语成为英文之外的第二交流平台,就能提高汉语的‘币值’,让科学融入汉语……我们的大陆文明很伟大,但是确实有缺陷;海洋文明有它的毛病,但是现代科学是海洋文明的产物,这方面它赢了。所以,当前任务是要认真进行历史反思,分辨传统文明的优点和缺陷,扬长避短发展现代科学,把东西方的优势放在一起,打造一个新的文明”。
早在2015年《文汇报》发表,汪品先院士写的《汉语被挤出科学! 还是科学融入汉语?》一文中,他说:“当前学术刊物‘英高中低’的现状是历史产物,相当长的时期内不可能根本改变”。该文引发了学术界的热议。汪品先院士说的事实是:在“高大上”的科技界,英语独大,汉语的地位却日渐式微。长此以往,中国会不会步上印度的后尘,方块文字被排挤在科学之外?
汪品先院士主张以中文汉语为载体,“开辟科学创新的第二战场”。
这实为中文和英文纠缠,“理论与实践、连续与间断”的最新最高举措。汪院士一贯道理说的是:物质产品的媒介是货币,交换智力产品的媒介就是语言。如果我们在用美元扩大国际贸易的同时,也在积极推进用人民币结算,那么在用英文加强国际交流的同时,是不是也应当考虑将汉语用作交流语言?讨论中国科学家的母语,一个绕不开的问题是方块字。方块汉字的前途,是我国知识界争论的百年话题。
对于汉语字的批评,首先来自其复杂难学。汪院士说:鲁迅先生把汉字比作“中国劳苦大众身上的一个结核”,“汉字不灭,中国必亡”。然而60年来的实践表明:通过汉字简化和义务教育,汉字完全可以为大众所掌握,本身并不是造成文盲的主要原因;相反,中国方言之间的差距不亚于一些欧洲语种的区别,方块汉字正是跨越方言阻隔的桥梁,是几千年民族统一发展的产物,也是维系民族统一的纽带。计算机技术的发展,为各种文字的前途提供了重新排队的机会。对于二进制的计算机编码,一个汉字只相当于两个拼音字母。
汉字承载的信息量远大于拼音文字,同一个文本,汉字的篇幅最短,汉字输入计算机的速度也最快。随着中国科学的发展和普及,随着世界科学力量布局的变化,为什么最多人使用的语言,就不该用作科学的载体?语言是文化传承的主角,以汉语作为载体的中华文化,在科学创新中应当具有潜在的优势。英文的全球化,是二次大战后美国建立全球优势后的产物。其实直到清朝早期的数百年间,汉字也曾是东亚文化圈的通用语。科学是世界性的,真理只有一条;但是走向真理的道路不应该只有一条,垄断不利于创新。
经验表明,用汉语的直接交流特别有利于学科交叉,有利于新兴方向的引入,有利于青年学者视野的开拓。如果我们同时也能坚持汉语在科学创新中的地位,就会呈现出一种崭新的局面:一些最初在国内提出的新观点,随后引起国际学术界的热烈议论;一些最初用中文发表的新概念,被译成外文在国外广为流传。发展的结果,必然是科学的精华渗入汉语,使汉语文化获得新生,并且产生出国际瞩目的新型文学和科普作品。对于一百年后的世界交流语言,今天谁也没有本事预测,可以肯定的只是信息技术发展将有深刻影响。“图文字”的拓展和人工智能对翻译的贡献,必将使不同语种之间的交流愈加容易,而不见得会有一种语言“一统天下”。我们希望,百年之后的国际语言交流中,华语将会获得重要的发言权。

26#
 楼主|王德奎 发表于: 2023-8-28 20:39:29|只看该作者
汪院士讲得多好多清楚啊。上海交大李侠教授2015年3月5日在“科学网”个人博客专栏,发表的《文化需要的是开放与公平而不是特设性保护》一文中也说:“当下国内学界的一个主要关注点是汉语在某些领域的式微,是否会导致一场毁灭性的‘去中国化’现象的出现?如话语权之争或者文化霸权等很多吓人的话题。中国文化体量之大,是任何其他文化所无法完全同化的。仅就还不算久远的清朝来说,满族文化最后被汉族文化完全同化,而不是相反。有关‘去中国化’的担忧,是一个精致的伪问题。印度的高端科技,都是用英语表达的,但印度在国际上的影响力并不是特别大。中国科技界目前的评价体系,从制度设置上就存在缺失公平,甚至是存在明显歧视性的政策安排,从而导致用中国纳税人提供的科技投入所得到的最好成果,最先获得思想启迪的却是外国人,相当于在变相地丰富另一个文化子系统的影响力。原本这些思想产品,是最应该先让中国人获益并实现群体思想激励的,然而现实却是,我们需要把这些最新的知识产品再通过转手贸易输入进来,从而带来双重损失的局面”。
李侠教授以上说的话都对,但以下说的话还值得研讨。他说:“文化的话语权,是以文化的优质产出为基础的,不是简单争来的。没有大量的优质文化产品与高端科技产品作支撑而幻想话语权,那无异于缘木求鱼。相信拥有庞大受众的中国文化,会释放出长期被压抑的创造力,并焕发出勃勃生机。我们有过诸子百家、有过新文化运动,那时的繁荣都与文化的开放、公平、自由有关”。
这里他说的“没有大量的优质文化产品与高端科技产品作支撑而幻想话语权,那无异于缘木求鱼”,也对。科技产品要讲“优质”,是一个基本要求。但“优质”能跟英文、中文中的“霸权”无关吗?国家掌握政权不是一个真空地带,“社会主义”是一个“优质”产品,发达国家并不想要;美国打造的“谷歌”,搜索科技文献的能力很强,但它在我国不遵纪守法,已被请出国门。英文和中文纠缠之争,不是“优质”之争,是人类命运共同体方向创新开辟第二战场之争。
鲁迅先生至今都还我们尊敬的革命家,然而汪品先院士也提到他把汉字看作“汉字不灭,中国必亡”。但汪品先院士说:“中国方言之间的差距不亚于一些欧洲语种的区别,方块汉字正是跨越方言阻隔的桥梁,是几千年民族统一发展的产物,也是维系民族统一的纽带。计算机技术的发展,为各种文字的前途提供了重新排队的机会。对于二进制的计算机编码,一个汉字只相当于两个拼音字母”。
英文和中文纠缠之争,实际是拼音符号文字与方块象形文字之争。曾祖先跟随中国用中文的韩国、朝鲜和越南等国,现今已改成用拼音符号文字或字母拼音文字;日本已改成大半拼音符号文字+少量方块象形文字。华东师范大学传播学院新闻学系潘妮妮教授说:“《三体》反映了一个文明在面临危机时的众生相”。实际《三体》反映的正是,拼音符号文字与方块象形文字之争在开辟第二战场之争。刘慈欣教授在获2015年雨果奖的《三体》第一部书中,除了“叶文洁”还有一个敏感的人物“程丽华”。如第8章“寂静的春天”中,程丽华是文革时某地中级法院军管会的军代表,她类似解释“俄乌战争”和其泛滥的原因:“一次政治学习会上,我说我们应该并入苏联……幼稚啊”。
如果鲁迅说的“汉字不灭,中国必亡”,按“程丽华”说的“并入苏联,即用苏联俄罗斯的字母拼音文字,这和英文属字母拼音文字不同吗?我们读高中时外语俄文是必学课;读大学时外语俄文也是必学课。但现在已全忘光了。当然新中国早期,苏联确实帮助我国提升过工业化建设,这是至今没有忘记的。但“让穷人翻身得解放”、“实现共产主义”,不是“去中国化”的字母拼音文字化的“文化霸权”。
李侠教授不是说:“印度的高端科技,都是用英语表达的”。印度摆脱英国的殖民后,为啥要搞医药专利改革?说的是仿制药让穷人患者看到生存的希望。这类似“以苏解马”优质文化如“让穷人翻身得解放”、“实现共产主义”吗?“以苏解马”搞阶级斗争,即使高端科技都用苏联类似的字母拼音文字表达,我们“扶贫”仍需要今天的“改革开放”政策。那么英文和中文纠缠之争创新开辟第二战场,不妨了解一下印度的专利改革:印度宪法规定,药品没有知识产权;不论哪个国家的药品,都可以仿制。这是“实现共产主义”吗?
这是1966年印度铁娘子英迪拉•甘地上台,推进专利法改革,发挥国家掌握政权的作用。这不是李侠教授说的“没有大量的优质文化产品与高端科技产品作支撑”,就是幻想;而类似有点“改革开放”,只保护药品生产过程中的专利,不保护药品的产品专利。即在印度,药品没有知识产权,后来还发布了强制许可政策。印度仿制药也确实价格低疗效好,让患绝症的穷人看到了希望。被欧美垄断的各类专利药,在印度基本可以找到仿制品。为啥印度可以搞仿制药呢?
新药研发,有一个“双十定律”,即十年的研发时间和十亿的研发费用,实际上还会超过“双十”成本。研发药企承担了绝大部分成本,如果没有法律提供专利保护期,所有研发新药的药企都会赔不剩,专利药根本没法和仿制药竞争。上个世纪70年代之前,印度沿用英国的专利法,大量的专利药被国际药商垄断,药价高到普通人无法承受。英迪拉•甘地颁布的专利法,印度仿制一款新药只要稍微调整生产工艺,就不会违反印度的药品专利法。靠着专利法,印度仿制药产业经过50年的野蛮发育,已经拥有完整的仿制药产业链。
2020年的数据显示,印度制药企业多达16000多家。全球十大仿制药企业,印度就占了5家。印度每年供应全球20%的仿制药,60%的药品出口到欧美和日韩,美国超过40%的仿制药从印度进口。
2011年德国拜耳公司对印度药企提起诉讼,但是印度政府压根不予理会,直接以“专利强制许可”驳回拜耳的诉讼请求。而且联合国帮忙让专利法也显得有人情味,如出台对药品专利,制定新规则:只要满足人口众多和经济不发达这两个条件,就可以在法律中保留“专利强制许可”制度。印度满足以上两个条件,只要部分药品的价格超过民众承受的范围,印度就可以无视专利法,强制对该药品进行专利授权。这种不保护专利的行为,颇有一种劫富济贫的味道。
但是资本不讲人情,印度市场曾一度成为国际药企的禁区。为了持续推动仿制药产业的发展,印度政府在2005年放开了药物试验限制,这等于是给国际药企开出仿制药的交换筹码。
为了降低临床试药成本,欧美药厂重新进入印度市场,在当地进行活人临床药物试验。有人说,找不到理由去批判,是专利法的确是维护资本的利益,保证了医药技术的进步;但穷人买仿制药也没有错,他们只是想拥有活下去的权力。印度的专利法只保护药品的工艺,不保护药品的成分。采用不同工艺,稍微修改不重要的成分,在法律范围内是被允许的,从而制造出更低廉、更高效的药物。中药也如此。
其实很多药的制造成本,只有几百几千块钱,但在印度之外要卖上几万甚至几十万,主要的花费就是专利。正是因为高昂的专利费,造就了高昂的药品费。因此自从印度专利法改革以来,印度本土的一些仿制药药商如雨后春笋般不断出现。拆开来讲,说是印度民众买不起,印度本土仿制药公司可以仿制。即不管你的专利过没过期,不管你的专利在哪使用,也不管你的专利在不在法律保护范围内,只要印度仿制药公司盯上你,难逃被仿制的命运。西方国家抗议归抗议,基本上都无效──一是只要你敢来印度开公司,他们就敢仿制。二是就算你不来印度开公司,他们还是敢仿制。只要印度仿制药公司说你公司制造的药物成本太贵,印度群众买不起,符合强制许可法。
照此逻辑,如果科技论文要大量优质,又对中文“去中国化”,那么我国政府,也可以推行知识产权改革:为对不懂英文的中国民众,做大语言模型训练,释放出长期被压抑的创造力,颁布国外发表的英文科技论文,可以被中文自由翻译在我国介绍传播,及中文科技论文可以在全球传播的保护法令法规,以满足国内外普及科学的需求。
b、生成式AI开辟中文第二战场合理作证
《生成式人工智能》一书作者丁磊教授,类似给“理论与实践,连续与间断”,用生成式AI为开辟中文创新第二战场的合理在作证。
2023年7月26日观察者网记者吕栋,发表的《专访丁磊:中国大模型厂商赶超美国,关键在这里》一文中说:“如今的生成式AI和前些年火热的AI概念有没有本质区别?催生生成式AI的关键技术有哪些?观察者网专访了美国俄亥俄州立大学人工智能专业博士、美国PayPal全球数据科学平台创始负责人丁磊”。
丁磊教授的分析是:AlphaGo不是一个普通的AI机器人,它以击败围棋世界冠军柯洁而名声大噪,背后依靠的主要是强大算力──围棋是比较复杂的棋类,但它是有规则的。AlphaGo这种AI机器人,通过大量的数据学习就能做到很优秀。所以在他看来,AlphaGo这种AI机器人,更像是在规则之下,通过大量数据不停地强化和迭代过程的数据学习,就能做到很优秀。那么英文和中文之争是什么?
是真正的通用人工智能(AGI)。以大模型为代表的生成式AI,可以说是今年全球科技圈最火热的概念,甚至没有之一。中国企业华为、科大讯飞、商汤科技等,这种本来就带有AI标签的公司,都在展示大模型能力。中英文的差距,人类的自然语言、文字相对的更复杂。英文聊天机器人ChatGPT所具有的知识和逻辑,从人脑学习的层面来看,跨越时空的尺度比AlphaGo更大,因为学习围棋相比于学习常识和逻辑,需要的时间更短。具体让一个人去学习的话,肯定比学习下围棋的时间要长。所以ChatGPT的里程碑式意义更大。
AlphaGo处理的主要是围棋数据,格式相对简单。虽然围棋中的内涵逻辑,包括取胜的规则也挺复杂,但它的底层数据结构更简单直白。而ChatGPT对应的是人类自然语言数据,存在的形式更为复杂、多样和多变,这也就从另一个角度印证了ChatGPT是AI领域更大的突破。从成熟程度看,AlphaGo类似决策式AI的应用,其更为成熟是已在互联网、零售、金融、制造等行业展开应用,极大地提升了企业的工作效率。而英文聊天机器人ChatGPT属于生成式AI,比AlphaGo “年岁更小”,是从2014年到至今才发展迅猛。

部分图片、文章来源于网络,版权归原作者所有;如有侵权,请联系(见页底)删除
27#
 楼主|王德奎 发表于: 2023-8-28 20:40:06|只看该作者
但应用方向来看,生成式AI也只是在文本和图片生成等应用内落地方面,指数级爆发类似决策式AI,如只在人脸识别、推荐系统、风控系统、机器人、自动驾驶等中,已有贴合日常生活的成熟应用。
智能中文聊天手机的普及,中美在AI领域的竞争,未来才会最引人关注。目前国内一些厂商,称自己的中文大模型部分能力已超越英文ChatGPT,并且很快将整体赶超英文ChatGPT。丁磊教授说:与其对比中美,不如对比中文和英文各自的科技训练模型。
不对比智能中文聊天手机这件事,就跟互联网思维模式的差别一样,各国企业其实没有本质差别,都可以做训练模型这件事,但谁能最终做出智能中文聊天手机的统一来,就需要一种新的思维方式。
比如,包括谷歌在内的互联网公司研发产品,采用的是“养鸡模式”,公司会将“养鸡”拆成不同的细分任务,多部门人员各自负责具体业务。而训练中文和英文GPT模型,是“养娃模式”,它类似反而不需要那么多老师、厨师。这不是说不需要14亿多中国民众来实践,而是说,它很难拆分成完全独立的任务,类似必须有固定父母站在全局角度,亲自教授培养孩子。
所以在这种模式下,美国谷歌没有最早做出智能中文聊天手机产品,原因是现有的分裂体系,很难在AI领域取得里程碑式的成功。训练中文和英文GPT模型,本质是一个很难拆解的事,需要公司领导层在技术、业务,甚至资本层都是专家。这能做到吗?
丁磊教授说:数据、算法和算力都很重要,但他认为,数据现在比较容易获得,很多数据都是互联网上的数据,可以很容易获得。最核心的还是算法,这关系到模型训练的效果。记者吕栋问:国内很多企业,现在训练中文模型需要使用中文语料,而中文可使用的语料,没有英文那么广泛,这会不会导致中美大模型之间产生差距?丁磊回答这确实是个问题──英文高质量的语料可能比中文要多,但这其中是不是也可以考虑做一些跨语言的翻译,然后再做模型训练。
但这里引发的争议也多。语料又称“语言材料”,作为语言研究的事实依据而收集的语音、词汇、语法素材及话语,通常是一定数量和规模的文本资源集合。语料规模可大可小,大至千万,甚至数亿句或更大,小至几百句。那么英文高质量的语料,比中文要多吗?
或者说用英文进行过标注的数据集,远比中文标注数据集完善吗?那么是中文有什么问题吗?有人说:不是中文的问题,是中文互联网巨头们的短视。又有说:用什么文字去表达是一种习惯,即我们常常听说的“生态”,与必不必须毫无关系;面向普通消费者的指令集或操作系统是一种商业行为,与市场占有率或消费者接受度相关,与科研水平没多大关系。国内有的公办大学、研究所、科学院,是政府资助,又不是商业公司,更不是国家政府,有那么必要搞一套自己的操作系统或指令集,强行收费,在市场中进行推广,从中赚钱对吗?
联系丁磊自己,他跟李彦宏、马化腾,是被称为中国的“互联网三巨头”的人物之一。丁磊在1987年考入了浙江大学无线电系,在大学最后一年,他创办了一家公司,凭借着对互联网行业的热情和坚持,公司逐渐发展成为中国最具规模的互联网公司之一。即他是网易的创始人兼CEO,他创立的网易公司,是一家全方位的网络公司,涉及网游、门户、邮箱、新闻、音乐等多个领域。在丁磊的带领下,网易的不断发展和壮大,也让丁磊拥有了更多的机会,结识了许多业内的大佬,也越来越有话语权。但丁磊身在国外英语世界,会去中国化吗?
1汉字怎样被边缘化?
2016年5月19日“红色文化网”,发表刘原教授的《汉字怎能边缘化?》一文中说:2006年7月5日的《中国青年报》发表题为《学术会议按惯例使用英语,汉语将沦为科学看客》的文章,说的是在中国召开国际会议,工作语言一律用英语,汉语靠边站,让好多参加会议的中国人听不懂,没有到达学术交流的目的。举例说两年前,在上海召开的“第四届全球华人物理学家大会”上,从印发的论文到演讲全是英语。部分海外华裔学者提出采用中英文双语,竟被组织者以国际惯例为由拒绝。对于这种科学会议上不使用汉语的现象,有一种惯常的解释:在这些领域领先的工作,主要是常常是美国人和英国人做的,所以外语常常是英语,几乎成了前沿工作者的通用语言,不用外语便无法进入最前沿。这个解释,在某种程度上也不无道理。
但有人说:这并不意味着使用外语作报告,就代表进入了科学研究的最前沿,而使用汉语作报告便是落后的。在与外国同行交流时主动使用外语,当然可以理解,但当面向国内同行或专业程度较低的听众时,为何不能大大方方使用母语呢?国内的科研进展,通过出口转内销才传到国内媒体,这种事并不鲜见。但现实当汉语被排斥于最新科技学术前沿之外,会无形中增加中国人学习科学和从事科研的成本。
还有人说:用什么文字去表达是一种习惯,即我们常常听说的“生态”,与必不必须毫无关系;面向普通消费者的指令集或操作系统是一种商业行为,与市场占有率或消费者接受度相关,与科研水平没多大关系。国内有的公办大学、研究所、科学院,是政府资助,又不是商业公司,更不是国家政府,有那么必要搞一套自己的操作系统或指令集,强行收费,在市场中进行推广,从中赚钱对吗?宪法还不是人定、人执行?英国没有宪法,即宪法不是国家的必需品;世界是多样性的,教义和宪法的作用差不多。一个领域研究的先进与落后,往往是动态的。落后,不是在所有方面都落后,也不应当甘于永远落后。
在学术研究领域,汉语要当多久的弱势语言?当中国最好的科研人员都放弃在专业上使用汉语发言,在科学话语权越来越重要的当代和未来社会,将对中国文化和汉语的前途产生怎样的影响?再说国家的冲突背后是文化的冲突,而文化是以语言为根基的,语言的推广统一才是千年大计。西方字母是纯符号。汉字的形音义是紧密联系的,何不按照特定的需求,编写自己的源代码或满足需求的基础操作系统,直接与硬件接口相连,输入计算指令?这种从源代码开始,即是自己开发的程序指令,用什么符号或文字,还不是开发者自己说了算。
看来这里有一个误区──科技论文对中文“去中国化”,中文和英文纠缠创新开辟第二战场,其实没有一点要代替英文英语的意思,而是取长补短。或者不是说:中国强大了,对其他使用拼音符号文字的国家就说,不同语言是国家冲突的原因,你们必须全部放弃本国语言,改学中文。这种第二战场,我们不愿意,他们也是不愿意的。
在科技领域研究的先进与落后,只是一种“连续与间断”的表现,是任何一个国家历史都有的“连续与间断”的体现。行路难,多歧路,承认这一点,是一个国家的自知之明。中国早在“立足山海时期(约公元前5070--4170年)”,就使用过古卦爻文字。计算器也最早开始使用算盘。现代进步,英文计算机超越中文计算器算盘,这是人类社会共同的进步,中华民族没有一点要自卑的。如bilibili(哔哩哔哩),在中国领先的年轻人文化社区,被粉丝们亲切的称为“B站”。即使它没有设定语言的功能,但如新加坡走的路,把英语定位在官方语言上,是因最早计算机不能显示汉字,那么只有掌握了英语才能使用计算机。也与早在1919年签订《凡尔赛和约》为对一战最大赢家美国的尊重,该和约成为世界上第一份正文用英语书写国际条约有关。
即英语崛起的最大动力,并非来自英语母语者,而是来自母语不是英语但讲英语的人。这标志着英语的崛起,法语的衰落,此后英语逐渐成为全球通用语言,至今104年。104年对于人的生命而论太久,但对于一个民族却很短。这也是中文和英文纠缠“理论与实践连续与间断”的一类体现:今天以英语为官方语言的国家有70多个,以英语为母语的国家有12个;但今天有超过98%的科学论文,是用英语发表的。使用非英语发表的文章,被视为对其国内交流──科学的霸权,就隐藏在看似中立的英语之后;“政治”之争,其实是表象。
2)中文能成为下一个科学语言文字吗?
bilibili(哔哩哔哩)如果今后能作为世界各国年轻人的文化社区软件,即使它没有设定语言的功能,但各国也有可能把中文定位在官方语言上,不“去中国化”,成为下一个科学语言文字吗?这也是我们说的没有一点要代替英文英语的意思,而是取长补短。像印度官方使用英文,也保留国内各民族有说本民族自己语言的权利一样。
如此科学英语将被中文科学所取代,在这种情况下,科学仍然将继续使用单一的语言,只是改为了一种不同于英文的语言。推翻一个国家的政局常有,推翻世界已成的局势难。中文汉语,显然是指统一各地方言的中国普通话为基础,成为未来唯一的科学语言的观点,当然主要是基于14亿多说中文人口数量集中于一地,以及地缘文明连续5000多年不断的检验力量。回顾一下中国悠久的自然知识的历史,中文汉语在整个亚洲从韩国和日本到中亚,再到东南亚,一直都是科学交流的重要语言文化。在这些地方,同样出现了为了适应中文汉字,偶尔也需要适应本土口语的压力;但中文汉语的实力毋庸置疑。
当然,中文汉语的这些推论存在两个问题:一个是经验上的,另一个是理论上的。经验上显而易见的是,尽管中国科学家和工程师的数量迅速增加,但他们实际上是当代英语发展的一个重要组成部分,因为高层的大多数投到国外的出版物,都是用英语发表的,而不是用中文汉语,有说是类似“黄皮肤的白人”。理论上的问题更为尖锐:究竟为啥要期望科学在未来只使用中文一种语言来统领众多其他语言?推翻一个国家的政局常有,推翻世界已成的局势难。但即使像拉丁语,除了文艺复兴鼎盛时期外,它在欧洲也不是唯一的科学语言。
说实在的:因有了人工智能(AI),中文和英文完全可以一起使用,编程语言不就是用语言文字表达0和1二进制吗,为啥不可以规范一套中文加数字字符的标准,一定要一直用英文加数字字符?如太极26卦爻。国家也许应该适应时代颁布一套基于中文的逻辑严谨编程基础语言体系,这样更有利于维护中文的文化根基。而且有人说计算机中文编程早有吴涛开发的“易语言”──吴涛还不是科班出身,没有名校背景,没有留学经历。然而他却完全依靠个人,开发出了这款功能完备、配套工具齐全的编程语言。你可以试试把易语言和中文编程Python(蟒蛇)同时给周围人推荐,看他们最终会选哪一个?

28#
 楼主|王德奎 发表于: 2023-8-28 20:40:45|只看该作者
只是后来“易语言”管理专注收费,锁死了它的发展。而在今日,唯一活下来的中文编程语言,正在程序员社区语言鄙视链的底端艰难生存。垃圾、骗子、病毒、从入门到入狱是它的代名词,它就是“易语言”──语言要推广发展就得开源;除非初创的,但后来想超越、想建立生态圈,就得靠群体智慧,就得开源,不然怎么争得过?
有人说:最近两年一个活跃于知乎等社区,叫吴烜的硅谷工程师,宣扬他的中文编程理念,就是基于主流编程语言开展中文编程实践。他认为程序员社区对中文编程有两大误区:第一是“只有中文编程语言才应该用中文命名标识符”;其次是“中文编程语言只要完成中文语法设计就行”。吴烜的理念是否得当?而且它收费,能否实现也难以预料。即便是全民英语的今天,英文命名、英文注释、英文文档,依然困扰着许多程序员。另一方面,在流行语言已经拥有巨大的标准库和第三方开源项目的情况下,这个轮子是否值得造?也值得商榷。
所以国内80后的程序员,都得要学英文。但几十年前“文革”时的计算机,输出来的都是在纸条上打孔,现在那就不是计算机了。但计算机只有开关表达0与1,哪认得什么英文还是中文?英文还是中文,只是被固化显示的字库,对芯片来讲,就是调用多少个开关比特显示特定的图像,方便使用者操作。但学习英文先进的东西,英文还没办法给你帮忙,这种学习方式有效吗?然而如果说中文基本上天生不适合做程序语言,因为同义词过多了,与“汉字不灭,中国必亡”的逻辑相连。还说做一个直接从0和1的二进制,转换成1万多个汉字的指令集出来,但这不是一句话就能实现几十年的跨越式发展。
西方字母是纯符号。汉字的形音义是紧密联系的,何不按照特定的需求,编写自己的源代码或满足需求的基础操作系统,直接与硬件接口相连,输入计算指令?这种从源代码开始,即是自己开发的程序指令,用什么符号或文字还不是开发者自己说了算?是的,英文ChatGPT挺火,GPT 1.0 2.0 都是开源的。它里面有个关键模型 transformer,用中文表达大概叫“转换器”。现在为了学习跟进,假设把 GPT开源代码都改写为汉字编程语言,除了中国的程序员,怎么跟全世界的程序员交流?怎么让他们帮忙找软件缺陷(bug)?
还有计算机编程基本上是数学和逻辑的关系,把编程语言汉字化,软件服务贸易怎么走出国门?中文不能提取逻辑严谨的汉字定出标准,配合数字符号替代英文+数字符号,那数学书怎么不是全英文?
即如果一种替代没有,为了中文而中文,不会有多大市场的,注定是小众的。这样的编程语言,有多大的发展前景呢?还有,键盘要不要换成汉字的呢?但以上非议,编程语言不就是用语言文字表达0和1二进制,为什么不可以规范一套汉字加数字字符的标准,一定要一直用英文加数字字符?编程底层是基于数学逻辑没错,但计算机编程语言,绝大部分只是表层,要不哪来哪么多种编程语言?但最底层的还是0与1,用中国话说就是开-关,是可对应卦爻文字符号的。
3)科学中文成功早有王选院士的成功作证
中文能成为下一个科学语言文字,中国有信心。早先的例子如“汉字激光排版之父”王选。1975年北大王选教授,开始领导研制计算机汉字激光照排系统。他和夫人北大数学系教授陈堃銶一起,带领此时已有5人从事相关研究工作。在王选汉字精密排版系统中,他将汉字输入计算机仅仅是第一步。中国研制的汉字激光照排系统,不仅价格便宜,而且比国外企业产品先进、实用,还不比国外企业产品差。
国产激光照排系统到90年代,甚至开始大举进军海外华文报业市场。我国不仅能够自主研发和发展自己的核心技术并实现产业化,而且还能将我国的高新技术产品打入发达国家市场。即1991年,王选带领北大科研集体,发明的计算机汉字激光照排技术,解决了汉字排版问题。到2017年,中文代码团队发明了中文代码编程技术,解决了汉字编程难题,结束了编写程序只能用英文的历史。
4)再论生成式AI助力中文聊天手机
未来用生成式人工智能完成整篇论文不是一个好主意──例如学生利用英文或中文ChatGPT写论文、做作业,就会形成一股势不可挡的浪潮。但生成式AI也可承担简单却耗时的任务,来提升科研效率,如编写摘要和生成代码。那它能再助力中文聊天手机的打造吗?
中文聊天手机的打造,能否学习中国核工业──从秦山一期起步,经历引进美国、法国、俄罗斯、加拿大核电技术的“万国牌”阶段,并在这一阶段完成了技术消化和产业升级,为国之重器—“华龙一号”的诞生创造了基础;中国民用核技术,也终于实现了从跟跑到领跑“迎头赶上”的历史性跨越。智能中文聊天手机科研、生产能力的消长变化,或许也能证明这样一个道理:科学、产业、文化、社会紧密耦合,朝向循环的“盛世”,并不是属于某种特定的意识形态或社会制度。
智能中文聊天手机的内在生命力,蕴藏在发展战略之中──科技发展战略的耗散、磨损与老化,导致产业现象层面外显的诸多现象。而如何塑造与维护良好的发展战略,智能中文聊天手机后发赶超这一发生在当下的工业化奇迹,将为全世界各国提供丰富的解析样本。
对此各抒己见,有人说如果科学,多半只是外语的事,与中文无关,那么智能中文聊天手机,肯定会介入与主人“聊天”的一些内容中的──如果当中文被排斥于最新科技学术前沿之外时,会无形中增加许多中国人学习科技和从事科研的成本──当最好的科学家在谈论前沿研究时,竟连中文都不会使用,好的中文原创科学文本难觅踪影,也就是必然的结果了。英文的互联网巨头,花钱做基础工作,我们还在沉迷于类似“抢菜贩饭卖”,智能中文聊天手机会无动于衷吗?。
英文或中文chatGPT没有那么神奇,需要动脑思考的工作统统替代不了,无脑的工作才能替代。程序员也有动脑的,也有无脑的。智能中文聊天手机哪天普及很难说──国内华为的盘古大模型,发布几年了,现在也只开源给很多企业,让企业根据自己的需要来训练。
基于工业上的应用,也在几个行业上落地,就不要一个劲吹国外的,先做智能中文聊天手机AI芯片,打造成国产的,再说其它,否则所谓的成果,很可能贡献给西方国家。这不是杞人忧天,英文或中文ChatGPT的ToC生成式,其应用有多大前景?长久看跟元宇宙、NFT等一样,风头很快会过去。但生成式AI结合大模型用于中文聊天手机,解决具体的科学、生产、生活问题却是实实在在的新风口。
华为老早就布局AI底座,比肩谷歌等系统,位列世界前三;华为的盘古大模型,好几年前就发布了,比英文chatGPT早;华为没兴趣做英文ChatGPT类的东西,而是专注工业应用。但像气动设计、气象预报、矿山管理、自动驾驶聊天类的东西,可以基于华为的底座,其他,让如科大讯飞的星火厂家来搞,这才是AI的正确发展方向。
1中文聊天手机属于通用人工智能
英文或中文chatGPT这种大模型,可以被看做是通用人工智能(AGI)吗?智能中文聊天手机出现,将推动社会产生极具颠覆性的发展吗?因为真正的AGI还需要跨越大语言模型大量训练这种门槛。
基于14亿多说中文人口数量集中于一地和地缘文明连续5000多年不断的检验力量,智能中文聊天手机不仅能够执行AGI技术这种中长期目标的特定任务,而且能够像大量中文主人一样,通盘理解和处理各种不同的信息。由此真正的AGI才能成为具有与人类类似或超越人类智能的计算机程序。所以虽然英文或中文ChatGPT等模型,在自然语言处理方面取得了一些进展,但仍然需要进一步研究和发展,才能逐步向着AGI的方向发展。
有人说,真正实现AGI须满足的要素,有点与“药物双盲实验”要求做一期、二期、三期……类似:首先是跨模态感知,将主人平时接触到的每个信息来源域称为一个模态,这些来源可以是文字、声音、图像、味觉、触觉等等。主人天然具有跨模态感知能力,能够对来自多种感官的信息进行整合和理解。
但当前绝大部分的人工智能系统,只能单独运用其中的一项作为传感器来感知世界,对于不同模态,需要设计不同的专有模型。其次是多任务协作,如给机器人发一条指令,让它帮忙拿一杯茶,它就会进行指令的理解、任务的分解、路线规划、识别物体等一系列动作。现在像英文或中文ChatGPT这种大模型,还不具备多任务协作能力。
第三,除了不仅能够同时完成多种任务,还能够快速适应与其训练情况不同的新任务体现外,还有自我学习和适应。即智能中文聊天手机的主人,应具有学习和适应能力,能够通过不断的学习和经验积累来提高自己的能力。因此,研究如何让人工智能系统具有自我学习和适应能力,也是实现AGI 的必要步骤。
第四,除了这其中主要包括增量学习、迁移学习和领域自适应三个方向外,还有情感理解──能够理解并表达情感,是手机主人最重要的特征。AGI在交流协作中甚至常常影响事件的下一步走向,当前不少生成式对话系统的工作,将关注点集中在提升生成语句的语言质量,忽略了对人类情感的理解。
第五是超级计算能力。实现AGI需要庞大的计算资源和超级计算能力,从不同角度出发为提升这一能力,英文或中文ChatGPT采取多种方法不断推进,但它只是像一辆汽车,主人不断升级油箱的容量、提高燃料的效率,以实现更远的行程。
丁磊教授的《生成式人工智能》一书中,提到一个词“transform”,是“转换”的意思;英文或中文ChatGPT与“转换”密切相关。智能中文聊天手机成为深度学习最亮眼的“转换”目标之一,这指就是它们的“转换器”意思。为啥智能中文聊天手机技术模型要叫“转换器”?其实这也正是“转换”的核心,也就是“转换”能实现的功能。
类似拓扑学几何中,球面与环面不同伦一样有区别,可以区分为球面序列与环面序列。如果这也类似称为“拓扑序”,那么人工智能拓扑序,从序列到序列,其谓“序列”,指的其实是文本数据、语音数据、视频数据等一系列具有连续关系的数据。在人工智能拓扑序的序列到序列模型中,只要能编码成序列,输入和输出的可以是任何形式的内容。而序列编码形式非常广泛,人们日常做的大部分工作,都可以编码成序列,因此智能中文聊天手机这种模型可以解决很多问题。即智能中文聊天手机在序列到序列模型基础上有三大提升:

部分图片、文章来源于网络,版权归原作者所有;如有侵权,请联系(见页底)删除
29#
 楼主|王德奎 发表于: 2023-8-28 20:41:24|只看该作者
一是采用多头注意力机制,和引入位置编码机制,能够识别更复杂的语言情况,从而能够处理更为复杂的任务。在智能中文聊天手机“转换”模型中,能输出或生成的内容更加广泛,包括文本、图像、语音、视频以及更广义的内容。即它可用生成报告、策划方案、代码以及程序等生成式AI通用型的模型,去生成任何主人需要的内容。
二是除像目前国内外的机器人大厂,基于“转换”技术推出自己的模型,且“转换”模型底层是开源的外,它能提升每个主人都可以利用“转换”技术,即是看谁可以设计出更加精巧的模型结构?
三是主人能首先改变模型结构外,提升还要看主人有没有更多更好的数据去训练模型,即比类似中英文ChatGPT的模型训练更多。
这三点首先要有一个类似人类大脑的框架在那里,也就是模型的结构。其次是训练模型的数据。第三是训练的方法。这三点决定了能训练出什么样的模型。这也叫深度,即是指模型在某一领域解决问题的能力更强,比如解决数学问题的能力更突出,或者在具体行业应用中,能把某一行业的问题解决的更专业,这就叫模型更深。
如果一个AGI模型只是够大,并不能解决相应的业务问题,或只能解决部分问题,给不出完全正确的解决方案,在很多情况下就会失去用处。因此AGI除了关注参数规模之外,还要看重模型的深度。
大部分的中小企业,并不会去参与中英文ChatGPT大模型的竞赛,相反会基于开源的大模型去研发,甚至中英文ChatGPT也都支持在线的训练和迭代。即这些中小企业会利用一些开源的AGI大模型,或者在线可以训练迭代的大模型,去解决业务场景来构建相应的“深模型”。当然这也是大部分中小企业,应该走的路。
2中文聊天手机的端到端优化之争
智能中文聊天手机“转换”涉及生成了“非常准确的摘要”,这只有接受针对它们主人的训练后,才“有可能生成这些摘要”。
智能中文聊天手机,正是通过大量的文本数据进行训练的,而且它的主人一般不会透露用于训练的具体数据。但中英文ChatGPT的训练,生产厂家和使用单位,通常是通过抓取网络数据进行的,包括使用存档的图书和维基百科的数据。大数学家丘成桐院士,给出坚定的回答:“人工智能不会代替人类思维”──目前人工智能无法识别几何背后的定律,更无法识别数学与其他科学之间的关联。
美国国家工程院外籍院士、粤港澳大湾区数字经济研究院创院理事长沈向洋教授也表示赞同:人工“智能”并不清晰,碰到挑战,很大可能是没有找到正确的数学工具和方法。沈向洋教授提到,比尔•盖茨直到2022年8月份,用英文ChatGPT大模型,做60道数学题,其中59道都对了,才相信英文ChatGPT的“智能”这件事真发生了。
但沈向洋教授说:有了这样的成功,也不代表接下来马上会继续不断地成功。这也指,利用AGI技术来辅助科学研究,发现自然科学的新规律,解决复杂的科学问题。但只有智能中文聊天手机,走这种需要有组织的科研的道路,把14多亿中国人组织起来,各方的配合,在社会主义的中国却能办到,而在其他任何国家都是困难的。
AGI技术已经在物理、化学、生物、医学等领域,取得了一些令人瞩目的成果。人工智能AGI技术,主要包括机器学习、深度学习、强化学习、神经符号系统等。数据驱动这类技术,都是通过从大量的数据中学习模式和规律,而不是依赖于预先设定的规则或假设。
这也使得智能中文聊天手机能够适应复杂多变的环境,捕捉细微的信号,发现潜在的联系。即 数据驱动这类技术,都是通过从大量的数据中学习模式和规律,而不是依赖于预先设定的规则或假设。智能中文聊天手机有10多亿部发行,且类似分布式又较集中表示,这也是一种“超大量技术”,即它是通过多层次、多维度、多模态,类似神经网络在表示数据和知识,而不是像中英文ChatGPT使用传统的符号逻辑或数学公式,这使得智能中文聊天手机,能够表达丰富多样的语义和概念处理不确定性和模糊性,实现泛化和迁移。
再说中文聊天手机的端到端优化之争──端到端优化技术,是指通过定义一个目标函数,或奖励信号,来指导学习过程,而不是依赖于人为设计的特征或步骤。这使得中文聊天手机能够自动地调整参数和结构,寻找最优或次优的解决方案,实现自适应和创新。端到端优化面对自然科学领域之争,有几个共同点:一是具有复杂性。自然科学领域涉及到多种因素的相互作用,多种尺度的变化,多种状态的转换,多种现象的出现。这些复杂性使得人类难以用简单的规则或公式来描述或预测,也使得传统的计算方法难以有效地模拟或分析。
二是不确定性──自然科学领域受到多种噪声和干扰的影响,存在着多种偶然性和随机性,涉及到多种概率和统计。这些不确定性使得人类难以用精确的数值或逻辑来度量或推理,也使得传统的实验方法难以准确地观测或验证。
三是创新性。自然科学领域不断地出现新的问题和挑战,需要不断地提出新的假设和理论,需要不断地发现新的规律和现象。这些创新性使得人类难以用既有的知识或经验来解决或回答,也使得传统的科学方法难以适应或更新。发现自然科学新规律的底层逻辑是利用人工智能技术,在大量数据中寻找分布式表示、端到端优化和自我强化的方式来模拟、理解和创造自然科学中的复杂、不确定和创新的现象。
当然,这并不是说AGI技术就可以完全取代科研工作者或传统科学方法。AGI技术仍然需要人提供数据、定义问题、解释结果、验证真实性等。AGI技术也仍然需要与数学、物理、化学等基础学科相结合,借鉴其原理、方法、概念等。AGI技术只是一种新的辅助工具,一种新的思维方式,一种新的探索途径,它能够帮助我们人类更好地认识自然,更好地推动科学。然而打开大脑,里面是一堆神经元。打开AGI技术,AI里面就是一堆函数──不仅仅是大模型,实际上在AGI技术智能的各种相关领域,算力都是命脉。
3中文聊天手机的算力之争
那么联系比如物联网,应用到AGI技术智能时,需要进行大量的设备数据处理、预测分析等任务,这也离不开算力吗?
有人说:看不见的精密计算与算力,AGI技术智能一天也离不开海量的算力;这是卡人工智能脖子的第一关。那么AGI技术扩展算力就行了吗?在AGI技术智能领域,提升算力可不容易。
训练和运行AGI技术智能,可不是随便找个芯片就能干的。
目前的主力芯片,是单片价值1万美元的A100芯片,它占据了数据中心AGI市场90%以上的份额。“核弹级AGI”光是先进芯片的成本就要2.5亿美元。可见训练和运行AGI技术智能被算力卡脖子,而算力又被先进芯片卡脖子。有时训练AGI技术智能的先进芯片即使贵,还拿钱买不到。我国半导体设备和材料被卡脖子,是以前依赖国外厂商,断供自然影响巨大。国外的制裁,也是瞄准这一弱点。
从AGI技术智能的前沿领域到算力卡脖子,到先进芯片卡脖子,再到制造先进芯片的设备和材料卡脖子,我国需要啥,国外就制裁啥。这种源头上的问题,我国正在解决。而且我国也在出手反制──锗、镓,都是战略性的基础原料,也是半导体制造的核心材料。我国镓的供给占比97%、原生锗的供给占比为70%以上。锗、镓在芯片制造、通信设备和国防等领域有着广泛的用途。在外国对高端半导体设备管控升级后,我国控制出口。越来越多国内厂商,也在切入半导体设备和材料先进工艺赛道,不仅能填补低端市场空缺,还能不断迭代升级。
相比国外的管制措施,相当于把我国巨大且不断增长的半导体设备材料市场,拱手相让。当然尽管这个增幅很大,但前方等待着的依然是星辰大海。讨论智能中文聊天手机,是盼望极大解放全人类的脑力,这也涉及算力的极大提升。要算力想不被卡脖子,也需要先进芯片;想要制造先进芯片,就不能被半导体设备和材料卡脖子。
有人说:向智能中文聊天手机迈进,百度的“文心一言”、阿里的“通义千问”、讯飞的“讯飞星火”等,这其中算法可能不是差距最大的环节,真正卡脖子的是很多人想不到的算力──算力对于训练大模型可是太重要──大模型想要包罗万象有问必答,就得动辄千亿级别的参数,这些参数需要在训练过程中不断更新和调整。
没有足够的算力,就无法快速更新这些参数。大模型见多识广还反应灵敏,离不开训练时灌入海量的数据,这些数据需要在短时间内被处理和分析。没有足够的算力,就无法快速地处理这些数据。要赶训练进度,大模型往往还要用分布式训练来加速训练。这种方法需要将模型分布在多个计算节点上进行训练,每个节点都需要足够的算力来完成自己的任务。其次,训练大型模型还需要复杂的数学计算,才能表现得足够聪明伶俐,这同样要消耗大量的算力。
这里不仅要算对,还要算得又好又快。但有人说:我们算力现在并不缺,如华为包场,这个包场指的是从上游芯片到框架到模型到应用再到云端运行,国外比如美国是英伟达提供芯片和底层,谷歌提供框架,各大公司架设模型,再有云商提供服务,比较分散,执行力远不如华为。国内除了华为,也还有其他的芯片、框架等,比如寒武纪,也有训练和推理芯片。华为盘古大模型,再看有些视频就知道,中英文ChatGPT只是千千万万应用大模型里最普通的其中之一。落后就是卡脖子?现在还能有建国那时落后?或影响你现在的幸福生活?
要说好的算法比算力更重要,是在芯片不行时,倒逼研究新算法,优化算法。华为是提供算力平台的,我国缺算力?新的人工智能算力是美国对我国制裁的核心,华为有那本事,美国还制裁个啥?
只要不自残,无论是贸易战,金融战,科技战,甚至是真枪真炮的热战,最后的胜利者一定是我们。反之只有一种可能,华为模型底层神经网络也是人家发明的。我国算是拥有世界顶级超算最多的国家,难道我国的超级计算机都是摆设?自从被制裁后,我国的超算发展其实是出于一个停滞的阶段。如“神威太湖之光”的后续型号“神威海洋之光”在原型机的建造后,由于没有能力生产所需的纳米制程(CPU7),所以这台拥有顶级算力的超算,一直迟迟不能完成。
在AGI技术智能领域,由于5G技术的率先普及和覆盖,我国的实际应用,比包括美西方国家在内的任何国家,都更广泛、更深入。

30#
 楼主|王德奎 发表于: 2023-8-28 20:42:04|只看该作者
c、开辟中文第二战场许仰天-黄峥模式借鉴
2006年在北京人民大会堂召开的国际弦理论大会上,几位发言的科学家都是直接使用英语,会场也没有同声传译设备,文本资料使用的也都是英语。这使得场下的6000多名听众,包括一些从外地赶来的大学生,大都没有听懂他们讲了些什么。
这一类的学术会议,通常会邀请几位外国学者参加,但他们的问题,完全可以通过向他们提供翻译服务来解决。当年国内民办经政府批准的互联网科学论坛很多,但因没有政府推行颁布保护英文科技论文被中文翻译传播及中文科技论文在全球传播的权利,使之能对不懂英文的中国民众做大语言模型训练,释放出长期被压抑的创造力的知识产权改革,以后一个接一个倒下关闭太可惜,太“去中国化”。
科技科学中文论文走出国门,可否借鉴许仰天-黄峥模式,是一个值得研讨的问题。所谓“许仰天-黄峥模式”,是指2023年的《新财富500富人榜》上,两位超音速般爆发的中国80后首富级企业家:一位是39岁的跨境电商平台SHEIN(希音)创始人许仰天,以1120亿元财富登顶广州首富。另一位是跨境电商平台Temu背后的拼多多创始人黄峥,则以2603亿身家成为上海首富。他们跨境走向世界推销介绍的产品,虽然不是科技科学中文论文这种语言文字形式,而是以实物做电商平台,但这中间的韬略智慧是相通的,可以借鉴的。
1)许仰天模式
科技科学中文论文开启一场回归自然的世界级“聊天”大对决,中英文东西方双双动用法律,作动作手段与反动作手段,虽然是必须的。但许仰天有一个观点:“成功不分国界”,这是一种模式吗?
许仰天,1984年生,山东淄博人。2007年毕业于青岛科技大学国际贸易专业;2008年在南京从事跨境电商业务,主要是卖婚纱。后来在一家外贸线上营销公司负责搜索引擎优化方面的工作,创立中国跨境电商平台SHEIN(希音)。2022年希音是全球搜索次数最多的时尚品牌,在113个国家和地区的顶级品牌排行榜中占据主导地位。
中文或英文科技科学论文发表,是在争市场、争用户吗?这是与“商业模式”不同的地方。如果科学是第一生产力,竞争本是正常和有客观评判标准的现象,如李侠教授说的:“没有大量的优质文化产品与高端科技产品作支撑而幻想话语权,那无异于缘木求鱼”。然而正是“话语权”有别,不管是在国内还是国外,不管过去还是现在和未来,都存在着“科技圈内”和“科技圈外”之间的竞争。如“话语权”不对等,“去中国化”本质是英文“科技圈”把自家看成是生产力的“科技圈内”,把中文“科技圈”看成是生产力的“科技圈外”。
中国80后的年青一代在“科技圈外”崛起,用商业产品模式证明中文或英文科技科学,不存在天生的“优质与高端”的差别。如“数字经济”本身属于科技科学,许仰天用数字经济手段为我国制造出海,提供超级出口。所以有人说,“希音”的出现,直接终结了比赛。
“许仰天模式”的秘笈,叫作“小单快反”──指用极小的首单单量,来测试市场;通过平台数据监测,发现某款商品具有“爆款”潜力时,平台再将信息返到工厂增加生产订单。因为不涉及大量提前生产,返单生产会极大地降低库存。依靠这种模式“希音”的一件服装,从打样到送到消费者中,只需要短短20天。每一天“希音”能实现平均5000款上新。相比老牌模式,“希音”模式,甚至改变了行业──即大量快速上新、极高性价比和高周转低库存,之前被老牌模式一直定义为:存在一个“不可能三角”,但“许仰天模式”,靠产品迅速迭代和足够廉价,很多品牌可以很快起飞。
这意味着老牌模式高投入,“希音”模式意味着低毛利,从而对企业周转效率要求更高,稍有不慎就会跌入“库存泥潭”。“希音”模式“小单快反”打破了“不可能三角”。许仰天和黄峥虽然出海有早晚,但市场上抓的是一样的用户群体;策略上用的都是低价和重营销,而供应端则是同一批中国服装厂商。早在2013年“希音”就将采购加工部,放在了广州,并组建了一支包括服装设计师和买手的产品团队。广州拥有完整的产业链和大大小小数万家服装企业。
坐拥7000多家服装工厂的番禺区,就是“希音”供应链的主要源头地。为了让供应端成为稳定高效的大本营,“希音”下了大功夫,长达十年时间,都在做供应链的数智化管理和提效。如为了测试和上新款,“希音”内部软件采用基于深度学习人工智能的视觉搜索引擎。
这种最先进的神经网络技术,能在十分之一秒或更短时间内进行识别。如林嘉贤的工厂与“希音”合作了五年,他说:有时每件只赚几美分,但每月能生产数十万件衣服。需求量如此之大,以至于难以接纳其他客户。“希音”很清楚:拥有庞大的供应链,不等于牢牢掌控,更不等于得心应手。但为了与上千家松散的小供应商双赢,“希音”提供了两个“策略武器”:信任交易和信息化管理──小作坊经营最怕“钱不到账”。很多供应商都死货款拖欠。“希音”从不拖欠款项,通常最快能结款是抢先吃到大红利的行动派。
2)黄峥模式
黄峥,1980年生,浙江杭州人。1998年在杭州外国语学校毕业,被保送至浙江大学竺可桢学院,主修计算机专业。2002年本科毕业后,被推荐到美国威斯康星大学麦迪逊分校就读,即黄峥是留过学的。
他2004年获得计算机硕士学位后,加入美国谷歌。2006年回国,参与谷歌中国办公室的创立。2007年从谷歌离职创业,先后创办手机电商、电商代运营和游戏公司。2015年创立拼好货上线,抓住传统电商未能有效助力农产品上行的机遇,以社交拼团模式,将产地农产品售给消费者。以此黄峥的公司内部,孵化新电商平台拼多多。
2016年黄峥宣布拼多多、拼好货合并成立新电商平台,并采用分布式人工智能与社交拼团模式,致力于为消费者提供更具性价比的商品;黄峥担任新公司的董事长兼首席执行官。这年黄峥记录创业思考,还公开发表《把资本主义倒过来》等文章,提出“个体对自身某个行为的确定性的把握,对满足需求的供给方往往是有价值的,它可以降低组织生产的不确定性。因此,有一种产品形式是:‘资本家出钱,给普通人买他的生产资本配置的确定性,形成反向的保险’”等新论,被称为“黄峥模式”的雏形。这里也许有个误区:有人认为黄峥留过学,就是“科技圈内”的,甚至是英文“科技圈内”的。
但面对“去中国化”,黄峥自知之明,因为他在国外“谷歌”更能感受“话语权”不对等,英文“科技圈”是把自家看成是生产力的“科技圈内”,把中文“科技圈”看成是生产力的“科技圈外”。黄峥有一个疯狂的构想:有没有一种保险产品或者机制,是可以从“穷人”卖向“富人”,让财富分配更均匀一些呢?所以“黄峥模式”也可以称之为“把资本主义倒过来”。即这类似开辟科技科学中文论文和英文纠缠创新的第二战场,进入世界英语“科技圈内”,也能够翻转成中文“科技圈”,让中文“科技圈外”──“穷人”,和中文“科技圈内”──“富人”,也能看到创造“大量的优质文化产品与高端科技产品的话语权”,是平等的。这里的体会、体验是什么?你懂吗?
“Temu”指“拼多多海外版”,即“Temu≠拼多多”。那么Temu在全球化上的更为激进:“把资本主义倒过来”是啥?黄峥付诸实践的是:2022年9月1日黄峥把拼多多以名叫“Temu”的手机软件,高调杀入美国市场。这个“倒过来”,也类似跨国公司的避税──2018年7月26日新电商平台拼多多在美国纳斯达克上市。2020年拼多多创始人黄峥退出公司董事,到2021年辞任拼多多董事长。
2020年4月25日黄峥曾发布股东信,从疫情与世界、人类与时间的关系角度,重新思考当下面对的现实。他认为“这股席卷全球的力量,将从根本上永久地改变我们所生存的世界”。
有人评论黄峥说:“他五年中带领拼多多一路披荆斩棘,打破了两强相争的电商格局,火箭般的发展速度创造了电商新物种神话。拼多多就像是一个精密算法,与拼多多一起不断蜕变。黄峥不以追求财富为唯一目标,而是沉浸在打造企业、创造价值的乐趣之中”。
3)其他模式
中文“科技圈外”和中文“科技圈内”,能看到创造“优质与高端科技”话语权的平等是中国80后的年青一代,在“科技圈外”崛起;虽是用商业产品模式证明中文或英文科技科学,不存在天生的“优质与高端”的差别,那么其他模式也许是科技科学知识产权的改革。
其实在德国等西欧境内的金琅学术出版社,早就在这样干出版──2019年我们发现,金琅学术出版社的一些外国编辑,只要瞄看到我国互联网公开论坛上,发表的长篇科技科学学术文章它们可用,并不事先通知作者,就出版推销,其中让作者付款去购买。虽然作者没有交如现在国内出版要交的出版费,但金琅学术出版社业也没有事先和作者签订出版合同,和说要付稿费的事。它们在书后打的广告词是:“绿色环保,按需印刷──通过全球发展最迅速的网上书店之一,快直接购买图书!”可见属于字母符号拼音文字的政府,早就在实行类似印度铁娘子英迪拉•甘地的“药品没有知识产权,不论哪个国家的药品,都可以仿制”的科技科学知识产权改革。所以“许仰天-黄峥模式”,本质是对不懂英文的中国民众做大语言模型训练,为释放出长期被压抑的创造力,在呼吁颁布保护国外发表的英文科技论文可以被中文自由翻译在我国介绍传播,及中文科技论文可以在全球传播的法令,以满足国内外普及科学需求的呐喊。但“绿色环保,按需印刷”可行吗?
有人说:“极低成本出口,竞争优势资源”,创造回流国内的价值,只是纸面盈利。“许仰天-黄峥模式”,打进老美市场,抓的是价格敏感型用户,打的是低价路线,在营销上不计成本。口号是,一起买,更便宜;而两家平台坐享薄利多销的红利。这样吃独食,将来即使形成垄断,人家出个反托拉斯法,到时候还没人帮你说话。
其意思是:正常点的做法,是把活分配到越南、印度等周边国家去,让利益链条分散大到老美没法一锤子打死你。国家应该管控“许仰天-黄峥模式”的内耗;这是以国内极地利润运转的出口竞争力资源,玩内耗,是短视内耗,老美等其他国家会在一旁伺机而动。

部分图片、文章来源于网络,版权归原作者所有;如有侵权,请联系(见页底)删除
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

© 2002-2024, 蜀ICP备12031014号, Powered by 5Panda
GMT+8, 2024-4-29 19:58, Processed in 0.062401 second(s), 7 queries, Gzip On, MemCache On
同板块主题的 后一篇 !last_thread! 快速回复 返回顶部 返回列表