算力供给侧大模型实际应用有何优势与局限?这场沙龙集思广益

为紧跟人工智能产业化前沿,破解大模型技术选型、落地应用与价值实现的行业难题,“大模型技术应用落地系列沙龙”首场活动8月22日在上海举办。本场沙龙以“算力供给与应用边界”为主题,聚焦产业化应用的核心环节,深入探讨算力供给侧大模型实际应用的优势与局限。
算力可以说是数字时代的战略性资源,智能算力更是典型的新质生产力,智算中心则是关键的基础设施。在上海临港,中国电信临港智算中心一期总共可承载10万卡智算集群,已规划/建成1万卡集群和部分定制算力池。二期项目拟投资250亿元,总建筑面积约30万平方米,未来将打造超级算力中心,支持万亿参数大模型训练。
临港算力(上海)科技有限公司市场经理曹春在主题报告中讲到,当前的大模型技术正从“单点突破”到“体系化跃迁”,技术拐点已至。现在的技术对于算力的要求非常高,且国内外TOP企业的算力规模尚存在巨大差距,因此需要更强大的智算中心基础设施。展望未来,曹春认为超级集群将成为常态,算力网络的“广域协同”更为关键;智算基础设施将深度融入行业,成为“数字生产力”的核心载体;绿色低碳将从“约束条件”变为“竞争优势”。
上海大学教授武星以“数据与知识双轮驱动的IDC智能运维”为题,深入解析了如何将海量行业数据与大模型基座高效融合,通过知识工程将原始数据转化为可驱动业务决策的结构化知识体系,通过数据治理建立特定的标准和管理规范,将之与大模型结合,有效避免“幻觉”问题。
如今,在编程这件事上,大模型也越来越多地参与其中。有人表示担忧,程序员是否会被大模型取代?浙江大学研究员余啸认为,一些低级的程序员有可能被淘汰,大模型在网页前端开发等任务中已经可以实现不错的效果。而高级程序员需要的是理解整体的项目架构,能够在和大模型的对话中清楚表达从而实现需求。对于学生或程序员来说,努力的方向应该是如何更好地去运用大模型。余啸认为,大语言模型还需要进一步加强处理复杂场景的能力,从而减少幻觉和不安全代码的产生。
圆桌论坛环节,与会专家、企业及投资机构代表围绕“伴随着技术进步,算力未来是否会成为技术发展的瓶颈”议题展开深入探讨,就算力供给模式的演进、推理成本的挑战以及性能与安全的平衡等问题展开交流,共同研判从技术迭代到价值创造的行业演进趋势。有人认为算力仍会是技术发展的瓶颈,必须考虑与之伴随的能源和成本问题;有人指出数据在未来更有可能成为瓶颈,目前获取新的真正有价值的数据并不容易;还有人提出要专注于专用领域的模型发展,小模型的落地或许会是未来瓶颈……
据悉,上海近期的技术沙龙不仅仅聚焦于大模型。围绕空天信息感知处理技术、元宇宙技术应用以及大模型技术应用落地等领域,一系列沙龙活动将进一步促进跨地域、跨学科、跨领域的融合创新,打造技术交流的产学研跨界融合平台。