英特尔表示,Hala Point 是第一个在主流 AI 工作负载上展示最先进计算效率的大型神经拟态系统。
表征表明,在执行传统的深度神经网络时,它可以支持高达每秒 20万亿次操作,即 20 petaops,效率超过 15万亿次8bit操作/秒/瓦(TOPS/W)。这可媲美并超过基于图形处理单元(GPU)和中央处理器(CPU)构建的架构所达到的水平。
Hala Point的独特功能可以为人工智能应用提供未来的实时持续学习,如科学和工程问题解决、物流、智慧城市基础设施管理、大型语言模型(LLM)和人工智能代理。
Hala Point的作用与重要性
桑迪亚国家实验室的研究人员计划将Hala Point用于先进的大脑规模计算研究。该组织将专注于解决设备物理、计算机体系结构、计算机科学和信息学中的科学计算问题。
“与 Hala Point 合作提高了我们 Sandia 团队解决计算和科学建模问题的能力。使用这种规模的系统进行研究将使我们能够跟上人工智能在从商业到国防再到基础科学等领域的发展步伐,“桑迪亚国家实验室Hala Point团队负责人Craig Vineyard说。
目前,Hala Point是一个研究原型,将提高未来商业系统的能力。英特尔预计,这些经验教训将带来实际的进步,例如LLM能够不断从新数据中学习。这些进步有望大大减轻广泛部署人工智能带来的不可持续的培训负担。
最近将深度学习模型扩展到数万亿个参数的趋势暴露了人工智能面临的令人生畏的可持续性挑战,并强调了在最低硬件架构级别进行创新的必要性。
神经拟态计算是一种全新的方法,它借鉴了神经科学的见解,将内存和计算与高度精细的并行性集成在一起,以最大限度地减少数据移动。在本月的声学、语音和信号处理国际会议(ICASSP)上发表的结果中,Loihi 2 展示了新兴小规模边缘工作负载的效率、速度和适应性提升几个数量级的提升。
Hala Point 在其前身 Pohoiki Springs 的基础上进行了大量改进,现在为主流传统深度学习模型带来了神经拟态性能和效率提升,尤其是那些处理视频、语音和无线通信等实时工作负载的模型。例如,爱立信研究公司正在应用Loihi 2来优化电信基础设施的效率,正如今年世界移动通信大会所强调的那样。
据英特尔介绍,接下来,Hala Point 将向桑迪亚国家实验室的交付标志着英特尔计划与其研究合作者共享的新型大型神经拟态研究系统系列的首次部署。进一步的开发将使神经拟态计算应用能够克服功耗和延迟限制,这些限制限制了人工智能功能在现实世界中的实时部署。
英特尔与由 200多个英特尔神经拟态研究社区(INRC)成员组成的生态系统(包括全球领先的学术团体、政府实验室、研究机构和公司)一起,致力于推动类脑 AI 的界限,并在未来几年内将这项技术从研究原型发展为行业领先的商业产品。
责任编辑:落木