人工智能正在经历第三轮浪潮。
上世纪的40-50年代,通用计算机的出现,带来了人类对人工智能的第一次探索;进入上世纪90年代,以日本第五代计算机成为重要标志的第二次人工智能浪潮,通过“通用推理”方式实现了部分人工智能。目前,我们正在处于机器学习带来的第三次人工智能浪潮。
在本轮AI浪潮中,一个突破性的变化是,人工智能已经在多方面超越人类。
随着人工智能的加速发展,使得算力规模不断扩大、算力需求持续攀升。在这样的背景下,如何更加高效地配置、共享、调度并释放更多算力,成为人工智能发展的一个新的挑战。
9月14日,在2023全球AI芯片峰会(GACS 2023)上,清华大学教授、中国半导体行业协会副理事长魏少军表示,未来人工智能技术需要从终端应用出发,以应用定义软件,再用软件来定义芯片,以满足各种人工智能终端设备的定制化需求,并提升算力的供给。
魏少军教授认为,工业革命延伸了人类体力极限,信息革命延伸了人类感知极限,而正在发生的智能化革命即延伸了人类的认知极限。
如今,智能化发展已经取得了巨大进步。以谷歌为例,谷歌的智能玩家比人类专业玩家能力强10倍,智能唇语识别的精准度达93.4%,语音识别的错词率只有5.9%。由机器学习推动的第三次AI浪潮,出现了突破性变化,即机器在多方面超越人类。
AI需要“软硬”协同的芯片架构
人工智能的发展在给人们带来惊喜的同时,也在不断推动人工智能芯片向前演进。从早期功能芯片到性能专用芯片,再到追求灵活性的可重构AI芯片。而随着大模型的出现,人工智能芯片的发展目标又转向高算力。
在魏少军教授看来,尽管智能化发展已经取得了阶段性的进展,但人工智能依旧存在两个现实问题。第一,算法在不断演进,新算法层出不穷。第二,没有统一的算法,只能一种算法对应一种应用。
现有的条件是,芯片制造完成后其物理结构基本特性随即固定,难以兼具高能效和高灵活性,来满足人工智能算法演进变化的需求。因此,亟需变革芯片架构和设计范式。
如何设计兼具高能效和高灵性的芯片,这就需要找到一种新的架构。魏少军教授认为,新架构要同时考虑硬件和软件两个部分。在计算机工作的过程中,芯片是承载智能运算的底层硬件,而软件则承载智能功能的实现。
“如何在软件和硬件之间形成有效结合?基于软件可编程性和硬件可编程性,我们将这两者构成AI芯片的坐标体系。比如,处理器放在第二象限,专用集成电路放在第三象限,FPGA放在第四象限。而第一象限,即是具备软件和硬件的双可编程性,通过软件和硬件之间的有机融合,来用软件定义芯片。”
在硬件结构方面,我们需要考虑如何利用软件来实现,将软件转换为一个可以与硬件结构匹配的大小分块。之后我们将推出一个分块软件系统。当硬件架构运行时,软件与硬件将实现映射。硬件功能不断根据软件编程结果的变化而发生变化。由此获得一个具备软件和硬件的双可编程性的智能架构芯片。
魏少军认为,“通用”仍然是人工智能芯片的主流架构,然而此通用非彼通用,未来的通用人工智能芯片,需要在通用的基础上,变得更加“智能”,以满足各种各样终端应用的定制化需求。
目前,我国在“软件定义芯片”的方向上做的比较好,实现了芯片架构和功能的纳秒级重构,使硬件电路可随软件算法的变化而快速变化,在确保灵活性的同时,大幅提升能量效率。
值得一提的是,如今,高性能计算机的计算能力已经进入E级时代,即每秒可进行百亿亿次数学运算的超级计算机。未来还将进入Z级时代,比E级还快1000倍。但在追求高算力的同时,在功耗和资金投入上花费都是巨大的。
2022年,世界第一的超算 E 级(1018Flops)美国Frontier超算的GPU芯片使用了先进的6nm工艺,可以达到1.1亿个Flops,若算力再提高到1000倍(z级时代),即使技术能达到3纳米,想要实现Z级计算,功耗为8000兆瓦,相当于2021年北京市总电力负荷的三分之一。
那么,8000兆瓦是8000万度电,一度电要花费5毛钱,用一个小时的400万人民币。前沿计算机花费了6.6亿美元实现了E级计算,相当于40亿人民币。
此外, CPU、FPGA、GPU等现有的计算芯片也难以满足下一代计算的要求,一是计算芯片计算资源占比低,仅不到0.1%;二是技术资源利用率低,仅不到5%;同时,数据传输能耗高达90%。
“在人工智能完全智能化的发展中,我们一个重要的任务就是提高芯片自学能力和接受教育的能力。如同人类接受教育和学习成长一样。但芯片并非如此,芯片出厂即巅峰,后面逐渐衰减。因此芯片在物理上无法实现不断学习成长。但智能软件是实现智能的载体,应具备自我学习能力,通过软件赋予硬件持续迭代的能力。”因此,在强大算力需求的推动下,若想让芯片变得更通用、更智能,可以以应用定义软件,再用软件定义芯片,保证芯片在具备灵活性的同时兼顾效率提升。
最后,魏少军教授总结了智能AI芯片应具备的基本要素:
1、学习能力、接受教育并成长的能力;
2、算法和软件的自主演进能力;
3、自主认知、自主判断、自主选择和自主决策;
4、可编程性:适应算法的演进和应用的多样性;
5、架构的动态可变性:适应不同的算法,实现高效计算;
6、高效的架构变换能力:<10 Clock cycle,低开销、低延迟;
7、高计算效率:避免使用指令这类低效率的架构;
8、高能量效率:~10 TOPS/W;某些应用: 功耗<1mW;某些应用: 识别速度>25F/s
9、低成本:能够进入家电和消费类电子
10、体积小:能够装载在移动设备上;
11、应用开发简便:不需要芯片设计方面的知识
芯榜:榜单评选.
人工智能/AI芯片 企业榜单(点击参与)
点击看:
1、无锡芯片36条(全文)
2、榜单发布!恭喜中科芯、思瑞浦、复旦微电、芯驰科技、芯擎科技等企业上榜(芯榜)
3、聚焦汽车半导体:2023年第五届太湖创芯峰会成功举办(芯榜)
4、第五届太湖创芯峰会重磅发布:全球智能汽车产业图谱及报告
本文首发于微信公众号:芯榜。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。