
郦波
3月7日下午,扬州讲坛迎来2026年度开年首讲,南京师范大学教授、博士生导师郦波以《降噪》为题,为现场听众带来了一场跨越文明、科技与人生的智慧分享。现将讲座核心内容进行整理,以飨读者。
汉字的选择
今天所讲的“降噪”,不是生活意义上的降噪,它是源于信息论中的一个学术词汇。1948年,信息论之父克劳德·香农发表论文《信息的数学原理》提出,信息论的两大基本原则:效率和降噪,而降噪其实也是一种选择。
从信息论角度上来讲,人类文明所产生的第一个符合信息论研究对象的群体,叫语言学。
我经常去欧美讲学,发现欧美中小学教育有个普遍现象。美国2023年数据统计,患有失读症的小学生占总数的21.07%,而中国基本没有小学生存在这种学习障碍。失读症,就是读书如果不发出声来,或不在脑海中发出声来,就无法理解意思。中国人基本不会出现这个问题,比如给你一段话,语序内容是混乱的,但并不影响你的理解。而在英语环境中,在默读中必须在脑海中发出声音,否则就无法理解意思。
英欧语系中,单词的组成要素是字母。以英语为例,仅有26个字母,有音、有形但无义,以线性序列组成单词,英语是二维字母叠加系统。面对世界快速变化,英语只有不断扩充词汇,尤其是科技领域的专业术语。从牛津字典将近39万个单词,到2009年美国将年度英语单词“web2.0”认定为第100万个单词,到至今英语单词总量约有200万个,最长的英语单词有45个字母、23个音节。如今,剑桥的学生可能都读不懂莎士比亚400年前的原文。而我们不仅能读懂400年前的汤显祖,还能读懂千年前的《诗经》和《楚辞》。
因为,汉语中汉字是基本单位,单个汉字既有音、有形,又能表义,从字到词到句,它是三维字符构建系统。据最新的统计,甲骨文3753个字、《说文解字》9353个字,到《康熙字典》47035个字,而常用字为5000个左右。这5000字可以造出25000个二字词汇、1亿2500万个三字词汇,汉字至今数量并没有什么变化,却有着巨大的扩充能力。
其实,人类早期原生文明都选择了象形文字,如玛雅文字、古埃及的圣书体、苏美尔文明的楔形文字、中国的甲骨文等。信息论的第一原则是效率原则,语言是要被听见的,为了让这个声音更好地被接收、被理解,人类选择了拼音文字、字母化。只有汉字放弃了效率这项第一原则,选择了象形—会意—形声、字符化这条极其艰难的道路,选择了信息论的第二原则——降噪,把语言的稳定性当做最大的原则。
人工智能的选择
汉字的选择,也是人工智能的选择。
近日,OpenRouter最新周度数据显示,全世界前十大通用人工智能模型调用的数据总Token(指大模型处理文本最小单位)量约8.7万亿,而中国的人工智能模型AI调用的Token量是5.3万亿,占比高达61%,当周Token调用量前三模型均为国产大模型。这是中国第一次在Token周数据上超过美国,也是中国数据确算在人工智能的应用上一个重要节点。
我们说,人工智能最重要的数据、算力、算法,它本质上就是马克思《资本论》说的生产资料、生产能力和生产关系。算法其实就是生产关系的突破。在系统端里,元素、关系、能力,最重要的不是元素和能力,不是数据和算力,最重要的是关系。
降噪,其实是选择一种关系上的稳定性进行突破。人工智能中大规模的数据到几千层级之后,需要数据的稳定性,降噪就可以保持它的稳定性。
人的选择
文明发展到今天,科技发展到今天,噪声巨大,让你逐渐淹没在“噪声”的洪流里头。
比如,物质生活富足,带来的代谢性疾病的高发。2024年,《中国抑郁症蓝皮书》统计的数据是,我国抑郁症患者50%是在校学生,其中,30%是18岁以下孩子。美国有测算数据表明,人类平均注意力时长仅为45秒。这些问题更深层次的表现,是生命主动权的丢失。
面对迎面而来的智能文明时代,人类文明的大智慧,是让你降噪。例如,面对海量信息、面对所有技术手段,包括AI,我们要当它是工具、或者是搭子,学会选择,才能找回生命的主动权。
无论是农业文明,还是智能文明,稳定性发展才是最根本智慧所在。不争一日之长短,要做时间的朋友。
记者 王鑫 林倩雯 王璐 文/图