视频 | “百模大战”,上海如何谋求胜算?
看呀STV
看看新闻KNEWS记者 金普庆 张俊
2024-02-11 16:44
“计算机能思考吗?”70多年前,英国数学家图灵提出这个问题后,人类就开始了对人工智能的探索。
随着科技飞跃式发展,ChatGPT横空出世不久,去年,生成式人工智能领域迎来了“百模大战”。
相较于AI1.0时代的判别式人工智能,AI2.0时代的生成式人工智能能力更强、应用更广。从文本对话到吟诗作画,人工智能大模型展示着它们的十八般武艺。在上海,目前已有24款大模型完成备案、可上线提供服务,数量位居全国前列。
“上午好,我是您的财富助手海小慧。”这家银行的手机客户端里,两名数字员工24小时在线,他们需要准确理解用户意图,并给出专业解答。“具体到数字员工的‘智慧大脑’,我们借助大模型的语言理解能力和多模态应用能力,完成了2000条问题数据和10万多条语料的知识库训练,”上海银行网络金融部资深副主管周东华介绍。
作为这一应用场景的大模型底座,这家企业自研的语言大模型,通过千亿级参数等数据训练,能充当编程、健康咨询等各类“助手”;还能帮助行业用户进行自定义模型开发训练。“今天去给它看一篇非常复杂的文章,人工智能可以非常短的时间内,帮你自动给文章做摘要和总结。传统上,我们认为都属于人类的思考推理判断范畴内的能力,今天,我们看到大模型已经越来越多地具备并且呈现出来,”商汤科技联合创始人、上海公司总经理杨帆告诉记者。
算力、算法和数据,是训练人工智能大模型的三个关键要素。
在位于上海徐汇的大模型创新生态社区“模速空间”,挂牌4个多月来,已经迅速集结起约50家大模型相关企业。在这里,“上下楼就是上下游”,灵感的火花在此碰撞、迸发。
在这家企业研发的通用视觉多模态大模型里,输入“90年代、上海黄河路、王家卫电影风格”等关键词,很快,人工智能生成的图片和短视频,就跃然眼前。“我们的模型基于1张图片,去推测后面图片的运动轨迹,把它拼成一起,就是一个4秒的短视频,”智象未来公司品牌负责人张一鸣介绍。目前,研发团队正在加速提升这一大模型能级;而算力紧缺,是当下企业成长过程中遇到的“小烦恼”。
看到下游企业的需求,同在“模速空间”的这家上游企业,自研了软硬件协同智算一体机等设施,能为大模型的研发和算力高效利用提供重要支撑。“能够把GPU(图形处理器)的使用效率提升2到4倍;就是说,我做同样的一个任务,原本需要2秒,现在只需要1秒到半秒,”无问芯穹公司首席执行官夏立雪说。
与此同时,“模速空间”里的五大公共服务平台,也能提供算力调度、大模型备案等支持。
上海大模型生态发展有限公司总经理陈海慈表示:“对标科创中心建设,整个‘模速空间’建设,跟过去做产业园区最大的区别来说,是我们不是以空间载体撑满为目标,而是以创新、创业,或者创新策源的浓度跟动能为评价标准。”
聚焦大模型创新能力、创新要素供给等方面,去年底,上海已正式发布11条举措,为大模型创新发展指明方向。
“我们要通向通用人工智能,还需要在基础研发方面继续往前走;同时,逐渐探索向各个行业落地的可能性,把大模型从闲聊的工具,逐渐变成能够跟场景的需要相结合、深入落地、提供价值的这么一个‘利器’,”上海人工智能实验室领军科学家林达华说。
版权声明:本文系看看新闻Knews独家稿件,未经授权,不得转载
暂无列表