05′16″

视频 | “百模大战”，上海如何谋求胜算？

看呀STV

看看新闻KNEWS记者金普庆张俊

2024-02-11 16:44

“计算机能思考吗？”70多年前，英国数学家图灵提出这个问题后，人类就开始了对人工智能的探索。

随着科技飞跃式发展，ChatGPT横空出世不久，去年，生成式人工智能领域迎来了“百模大战”。

相较于AI1.0时代的判别式人工智能，AI2.0时代的生成式人工智能能力更强、应用更广。从文本对话到吟诗作画，人工智能大模型展示着它们的十八般武艺。在上海，目前已有24款大模型完成备案、可上线提供服务，数量位居全国前列。

“上午好，我是您的财富助手海小慧。”这家银行的手机客户端里，两名数字员工24小时在线，他们需要准确理解用户意图，并给出专业解答。“具体到数字员工的‘智慧大脑’，我们借助大模型的语言理解能力和多模态应用能力，完成了2000条问题数据和10万多条语料的知识库训练，”上海银行网络金融部资深副主管周东华介绍。

作为这一应用场景的大模型底座，这家企业自研的语言大模型，通过千亿级参数等数据训练，能充当编程、健康咨询等各类“助手”；还能帮助行业用户进行自定义模型开发训练。“今天去给它看一篇非常复杂的文章，人工智能可以非常短的时间内，帮你自动给文章做摘要和总结。传统上，我们认为都属于人类的思考推理判断范畴内的能力，今天，我们看到大模型已经越来越多地具备并且呈现出来，”商汤科技联合创始人、上海公司总经理杨帆告诉记者。

算力、算法和数据，是训练人工智能大模型的三个关键要素。

在位于上海徐汇的大模型创新生态社区“模速空间”，挂牌4个多月来，已经迅速集结起约50家大模型相关企业。在这里，“上下楼就是上下游”，灵感的火花在此碰撞、迸发。

在这家企业研发的通用视觉多模态大模型里，输入“90年代、上海黄河路、王家卫电影风格”等关键词，很快，人工智能生成的图片和短视频，就跃然眼前。“我们的模型基于1张图片，去推测后面图片的运动轨迹，把它拼成一起，就是一个4秒的短视频，”智象未来公司品牌负责人张一鸣介绍。目前，研发团队正在加速提升这一大模型能级；而算力紧缺，是当下企业成长过程中遇到的“小烦恼”。

看到下游企业的需求，同在“模速空间”的这家上游企业，自研了软硬件协同智算一体机等设施，能为大模型的研发和算力高效利用提供重要支撑。“能够把GPU（图形处理器）的使用效率提升2到4倍；就是说，我做同样的一个任务，原本需要2秒，现在只需要1秒到半秒，”无问芯穹公司首席执行官夏立雪说。

与此同时，“模速空间”里的五大公共服务平台，也能提供算力调度、大模型备案等支持。

上海大模型生态发展有限公司总经理陈海慈表示：“对标科创中心建设，整个‘模速空间’建设，跟过去做产业园区最大的区别来说，是我们不是以空间载体撑满为目标，而是以创新、创业，或者创新策源的浓度跟动能为评价标准。”

聚焦大模型创新能力、创新要素供给等方面，去年底，上海已正式发布11条举措，为大模型创新发展指明方向。

“我们要通向通用人工智能，还需要在基础研发方面继续往前走；同时，逐渐探索向各个行业落地的可能性，把大模型从闲聊的工具，逐渐变成能够跟场景的需要相结合、深入落地、提供价值的这么一个‘利器’，”上海人工智能实验室领军科学家林达华说。

APP 内打开

打开看看新闻参与讨论