到底什么是语义通信？

大家好，我是小枣君。

今天这篇文章，我们来聊一个非常酷的话题——语义通信。

大家都知道，自从信息革命爆发以来，我们的信息量（数据量）就在不断膨胀。

文字、图片、音频、视频……越来越多的数据在不断产生，不仅占据着我们的硬盘空间，也充斥着整个通信网络。

这些数据让我们的工作和生活更加便利，也推动着社会的进步和发展。

进入21世纪后，在云计算、大数据、物联网和人工智能的共同刺激下，数据的增长趋势更加猛烈。

根据IDC的报告，到2025年，全球数据总量将达到175ZB，约等于1750亿TB。

而ITU则预测，全球移动数据流量的年增长速率将会在2030年达到55%。2030年的数据流量，将是2020年的100倍。

面对如此巨大的流量增长，人类现有的通信技术手段，已经疲于招架。

1948年，祖师爷克劳德·香农（Claude Elwood Shannon）发表了那篇经典论文——《A Mathematics Theory of Communication（通信的数学理论）》，标志着信息论的诞生。

后来，1949年，他又发表了《Communication in the Presence of Noise（噪声下的通信）》，阐明了通信的基本问题，给出了通信系统的模型，以及著名的香农公式。

从那之后，我们就一直在信息论和香农公式的基础上，进行通信技术的研究。

经过70多年的积累，我们的通信技术已经无限接近于香农极限。以huffman编码、算法编码为代表的信源编码技术，把信源数据压缩到了极致。而以LDPC码、极化码为代表的信道编码技术，把信道也利用到了极致。

那接下来，该怎么办呢？面对万物智联时代的数据洪流，我们的优质频谱资源越来越少，硬件和能耗成本越来越高，该如何应对？

█ 通信的三个层级

大家不妨冷静思考一下。

一直以来，我们在通信技术上所做的努力，似乎都在做一件事情——把携带信息的符号，完整、准确、快速地从信源发送到信宿。

这就好像一个勤劳的快递员，他的唯一使命，就是把寄件人交给他的货物，完好无损且快速地，送到收件人的手上。

那么，当货物实在太多，快递员真的已经拿不动的时候，他会不会蹦出这么一个念头——这些货物，真的有必要全送吗？

大家或者也会有这样的经历：

你想在网上搜索一部好看的电影。你挑了一部，花了好久的时间，终于下载完成，结果，你打开一看，根本不是自己喜欢的。于是，你就只能删掉它。

网络辛苦完成的数据传输工作，没有发挥价值。你的时间，也浪费了。

是的，在这里，我们就会想到——通信的终极奥义，究竟是什么？

事实上，早在现代通信理论奠基之际，先贤们就考虑到了这个问题。

1938年，美国哲学家查尔斯·莫里斯（Charles William Morris）提出了符号论。他指出，符号应该包括了语法-语义-语用三元概念。

克劳德·香农提出信息论后，和沃伦·韦弗（Warren Weaver）一起对自己的理论和模型进行延展完善。他们合著了一本书，名字仍然叫《通信的数学理论》。

他们俩当时就意识到，语义在通信中的重要性。于是，他们提出了通信的3个级别，即Level A/B/C。

Level A：语法通信，解决技术问题，即通信符号如何保证正确传输；

Level B：语义通信，解决语义问题，即发送的符号如何传递确切的含义；

Level C：语用通信，解决有效性问题，即接收的含义如何以期望的方式影响系统行为。

长期以来，经典信息论局限在语法信息传输层次，即Level A。也就是说，我们一直在研究怎么把数据传过去。

如今，在传统通信已经进入瓶颈的情况下，我们就可以考虑一下——是不是可以在语义通信上，寻找突破点。

█ 语义通信的特点

语义通信（Semantic Communication），是以任务为主体，“先理解，后传输”的通信方式。

它会对原始信号进行有选择的特征提取、压缩和传输，然后再利用语义层面信息进行通信。

如果我们把传统通信看成是形式通信的话，那么，语义通信就是“达意通信”、“内容通信”。

换句话说：“不能傻干活，要多动脑子。”

通信的真正目的是什么，是让对方了解自己的意思。说话，只是一种表达方式。话的本身，也是为了表达意思。那么，就没有必要进抓着这句话不放，而是看如何更高效地传达意思。

从学术上来说，降低接收者对信息的不确定性，或者说，使接收到的信息熵减少至0，让接收者正确理解发送者的信息内容，就是“达意”通信。

大家平时沟通交流，也会注意到：对于陌生人，你需要千叮咛万嘱咐，确保自己的意思被理解。而对于你很亲近的人，有时候，一个眼神就足够了。不是吗？

“你懂的”

语义通信和传统信源编码的区别在哪里呢？

传统信源编码是对信息本身的压缩，它寻找数据的规律，通过算法进行数据精简。而语义通信，重在“理解和消化”，讲究的是“智能”。

█ 语义通信系统的架构

语义通信可以显著降低数据流量，提高通信效率。那么，它究竟是如何工作的呢？

语义通信目前还处于早期研究阶段，不同的研究团队，有不同的语义通信架构设计。

而且，针对不同类型的通信（文本通信、图像通信、音视频通信等），不同目的的通信（是否有特定任务），也会有不同的语义通信模型和架构。

早期的一种模型，是在传统经典通信系统上叠加语义通信。

在发送端，信源产生的信息首先送入语义提取模块，产生语义表征序列。接着，送入语义信源编码器，对语义特征压缩编码。然后，送入信道编码器。最后，进入传输信道。

在接收端，先信道译码，再语义译码。得到的语义表征序列，送入语义恢复与重建模块，最终得到信源数据。

中间那段信道部分，就是传统经典通信来实现。

另一种现在比较有代表的模型，是信源信道联合编码。这种方式，更有整体性，全盘思考。

大家能看出来，相比传统通信，语义通信多了一个知识库。其实，有的模型并没有知识库，直接在语义编码器上硬刚。

更多的系统模型，是基于知识库的。系统模型的性能和准确率，高度依赖于知识库。

知识库就有点像密码本。如果两端的知识库不一致，那么，语义通信是无法正常工作的。

知识库又不像密码本那样，内容固定且形式单一。知识库由很多的语义知识图谱组成，分为多个层级，可以对现实世界中的实体、概念、属性以及它们之间的关系进行建模。

基于知识库，进行语义理解，就需要前面我们所说的“智能”。

谁最适合干这个活？当然是AI人工智能。

简单来说，就是让AI来完成语义理解的工作。语义编码与译码模块基于海量数据训练的知识库，通过深度学习网络来拟合语义的特征，可以高效提取与重建语义信息。

这也是为什么，最近十几年来，语义通信开始重新被提及的原因。

早在1956年，法国物理学家L.布里渊（L.Brillouin）就指出，经典信息论忽略语义通信，是因为工程需要（要先解决基本需求），并不意味着人们要永远忽视语义信息。

如今，一方面传统信息论遇到瓶颈，另一方面AI人工智能技术日益成熟，所以，我们重提语义通信的时机就成熟了。

特别值得一提的是，AI人工智能可以帮助语义通信，反过来，语义通信，也非常适合人工智能的发展。

大家应该能够理解：同类型主体之间的通信，往往容易简化。就像人和人之间，通信肯定比人和牛之间简单。

未来，我们正在朝着智能化的方向发展，AI人工智能批量应用之后，就会有很多的智能体。这些智能体之间，就会有大量的通信需求。而语义通信，本身就是AI在进行“翻译”，对于智能体通信，肯定会有更大的优势。

█ 语义通信面临的挑战

语义通信的发展前景，行业是一致看好的。但是，想要让这项技术投入实用，真正发挥价值，并不容易。

首先，语义通信的基础理论体系，并不完善。

香农的信息论，给传统语法信息奠定了理论基础。他用一个简单的对数公式，就把信息（熵）明确定义出来；用香农公式，又把语法通信的信道容量边界也划定了。

对于语义通信，还没有人完成这两项重要工作。相对于语法通信，语义通信缺失严谨的数学表征，没有扎实的理论依据。

语义通信的信息度量方式，目前也没有特别明确。

传统语法通信有误码率、丢包率之类的指标，用于衡量服务质量。语义通信关注“达意”，不关注“精准传输”，所以，这些指标都用不了。

在语义通信中，只能会采用宏观的任务完成质量或语义准确率，来进行系统性能评估。

说到准确率，这是语义通信的第二个大问题。

以目前现有的技术，即便是用上了AI人工智能，仍然无法做到完美的准确率。语义的识别与恢复，比想象中难得多。

第三个问题，是适用场景问题。

通信是一件复杂工作。数据是多样化的，有结构化数据，也有非结构化数据。文字、图片、音视频，还有一些特定的通信任务，混在一起，很难借助一个有范围限制性的知识库，进行语义提取。

例如，我们采用工业制造场景的知识库，去进行农林牧渔场景的语义通信，肯定不行。但是，通信场景的边界，又该如何精确划分？

知识库还涉及到第四个问题，那就是安全问题。

在现实情况下，如何维持两份高度一致的知识库？如果对知识库进行传递，会不会泄密？如何保障知识库不被入侵和扰乱？

总而言之，语义通信面临的挑战还有很多。这些还都是理论研究上的问题，将来如果产业化，问题还会更多。

█ 语义通信的研究进展

前面说了，语义通信目前还处于早期研究阶段。2010年至今，这个概念的研究热度是越来越高的。

在国内，很多高校都进行了一些语义通信模型的搭建，并取得了初步进展。

最有代表性的，是北邮张平院士及他的团队。

2022年左右，他们针对6G的智简演进需求，提出了一种新的语义信息表征模型——语义基（Seb）。

语义基是语义信息的基本组织单元，类似于香农在传统信息论体系中的比特（Bit）。它以更为结构化、简约化、弹性化的方式对信息进行组织，为描述涉及网络意图的语义信息提供了新的视角。

他们还提出了面向6G的“一面三层（语义智能平面、语义物理承载层、语义网络协议层、语义应用意图层）”智简网络协议架构，为语义通信的研究提供了重要参考。

除了高校之外，部分企业也参与到语义通信的研究和实践中。

以中国移动为例，他们和清华大学合作，搞了一个面向人脸场景的会话视频语义传输方案，在中移平安乡村网络中进行应用，效果不错。

相比于传统H.264编码，针对人脸场景，语义通信在相同用户体验下将码率降低为10-20%，即降低到3KB也能获清晰流畅体验。

█ 结语

总而言之，语义通信技术，拥有巨大的研究潜力。

它是通信系统设计思想、理念的一次重大变革，很可能彻底颠覆我们现有的信息通信技术体系。

面向未来，语义通信到底是骡子是马，就让时间来告诉我们答案吧。

——全文完——

参考资料：

面向未来的语义通信：基本原理与实现方法，张平等，《通信学报》；

迈向6G智简网络——基于语义通信的网络新范式，张平等，《Engineering》；

语义通信：原理与挑战，秦志金等；

语义通讯——智能时代的产物，石光明等；

面向万物智联的语义通信网络，石光明等，《物联网学报》；

面向6G的语义通信，牛凯等，《移动通信》；

基于信息论的语义通信：理论与挑战，施雨轩等，《中兴通讯》；

面向6G的语义通信系统，王碧舳等，《移动通信》；

到底什么是语义通信？

作者鲜枣课堂

作者鲜枣课堂

相关文章

到底什么是“无网通信”？

到底什么是鱼鳞组网？

到底什么是“堡垒基站”？

发表回复取消回复

到底什么是语义通信？

作者鲜枣课堂

作者 鲜枣课堂

相关文章

到底什么是“无网通信”？

到底什么是鱼鳞组网？

到底什么是“堡垒基站”？

发表回复 取消回复

作者鲜枣课堂

发表回复取消回复