客户端
游戏
无障碍

12

评论

4

15

手机看

微信扫一扫,随时随地看

这个AI火爆全球,创始人是来自广东的“85后”

近日,中国AI初创公司
深度求索(DeepSeek)
在中国、美国的科技圈受到广泛关注
被不少人称为“神秘的东方力量”
1月27日,DeepSeek应用

登顶苹果美国地区应用商店
免费APP下载排行榜

甚至超越之前大火的ChatGPT
图片

同日,苹果中国区应用商店免费榜显示
DeepSeek成为中国区第一

图片


其网页版甚至出现了短时间的宕机
在1月26日,有消息称DeepSeek
遭遇了一次短暂的服务中断
据DeepSeek官方回应
是因为吸引了大量用户的涌入
导致服务器在短时间内
难以承受如此高的并发访问量

DeepSeek为什么火出圈
DeepSeek,全称“杭州深度求索人工智能基础技术研究有限公司”
它的火爆,起因是他们发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。
DeepSeek对模型架构进行了全方位创新。它提出的一种崭新的MLA(一种新的多头潜在注意力机制)架构,把显存占用降到了过去最常用的MHA架构的5%-13%,同时,它独创的DeepSeekMoESparse结构,也把计算量降到极致,所有这些最终促成了成本的下降。

图片

这样的“中国式创新”
带来的是AI大模型领域的一次颠覆:
此前大模型领域的发展轨迹
大都是靠算力的堆砌而艰难向前的
一方面导致了行业的成本居高不下
另一方面也让英伟达等
提供算力的企业赚得盆满钵满

图片

但是DeepSeek通过底层架构的方式
改变了发展的思路
用通俗点的说法来讲
就是好比现在大家认为
小龙虾是一道能够持续火爆的美食
而五星级酒店大厨们通过昂贵的
名牌炒锅和严选的食材
做出来的小龙虾味道极佳得到了大家的认可
而突然一家不知名的小菜馆
用普通的十三香就能炒出来同样甚至更好的味道
价格只要五星级酒店的几十分之一
而且这家小菜馆
还把所有配料和方法都公开了!

这位“大佬”,来自广东
近日,一名“85后”
DeepSeek创始人的身份
现身《新闻联播》
参加了一场国家超高规格座谈会
并现场发言
他发言的照片
流传于各类社交平台

图片

他就是来广东自湛江的梁文锋
记者从梁文锋的初中班主任获悉
梁文锋是湛江市吴川市覃巴镇米历岭村人
他小学就读于吴川梅菉小学
父母都是小学语文老师

2002年,17岁的梁文锋以吴川一中“高考状元”的成绩考上浙江大学本科电子信息工程专业,于2007年考上浙江大学信息与通信工程专业研究生。据悉,在大学期间,梁文锋就与同学一起开始积累市场行情数据和探索全自动量化交易。


2023年,梁文锋创立深度求索品牌DeepSeek。


在谈到中国如何应对科技创新时,他曾谈道:随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。


据悉,今年春节梁文锋会回湛江吴川过年。祝愿这位名耀海外的“大神”,创造出更多的奇迹。


-End-

源丨综合网络
编辑丨徐文杰
审核丨黄靖茹 解廷辉
免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部