你的位置:九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载 > 新闻动态 > 九游体育娱乐网DeepSeek仍是全面上线了 R1-九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载

九游体育娱乐网DeepSeek仍是全面上线了 R1-九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载

时间:2025-02-23 08:40 点击:183 次

专题:DeepSeek为何能调动全球AI圈

  起首:全产业链参谋

  1月20日下昼,总理主抓召开行家、企业家和教科文卫体等领域代表谈话会。

  此前,相称少出面的DeepSeek雇主梁文锋,受邀过问并发言。

  中国AI界的听说大佬,真东谈主比思象中还年青啊,皮肤崇尚好,看着还以为是学生代表。

  这是见证历史性一刻,AI大佬上新闻联播了。

  在过问总甘愿议的合并天,DeepSeek在官微上,发布了DeepSeek-R1 发布,性能对标 OpenAI o1 郑再版。

  DeepSeek-R1 在后磨砺阶段大领域使用了强化学习技能,在仅有少许标注数据的情况下,极大擢升了模子推理才智。

  在数学、代码、当然话语推理等任务上,性能并排 OpenAI o1 郑再版。

  R1的32B和70B版块,性能远远跨越了OpenAI的GPT-4o,并贴近 o1-mini。

  咫尺,DeepSeek仍是全面上线了 R1,大家不错径直体验。

  好意思国建筑规划工作室 Workshop-APD 的首创东谈主Matthew Berman 暗示:DeepSeek R1 领有我所见过的最像东谈主类的内心独白。

  咫尺土产货运行的 14b DeepSeek R1 蒸馏模子,能够把问题回应成这样,咱还要啥自行车呢?

  17岁考入浙大

  30岁创办幻方

  如斯横暴的DeepSeek大模子,背后并是不什么互联网科技大厂,而是炒股的。

  DeepSeek深度求索,来自金融领域的头部量化:幻方量化。

  梁文锋是幻方量化的本体逝世东谈主,他在DeepSeek最终受益的股份比例超80%。

  1985年,梁文锋出身于广东湛江,那儿盛产生蚝。他本硕就读于浙江大学,攻读东谈主工智能,年青念书时就细目“AI定会改变宇宙”。

  2008年,在浙大念书期间,23岁的梁文锋与同学一谈组团队启动积攒阛阓行情数据、金融阛阓其他商酌数据以及宏不雅经济等数据。

  梁文锋启动使用机器学习等技能,探索量化来回。

  他的硕士毕业论文题目是《基于低资本PTZ录像机的指标追踪算法参谋》。

  梁文锋暗示:我方是八十年代在广东一个五线城市长大的。

我的父亲是小学针织,九十年代,广东赢利契机许多,其时有不少家长到我家里来,基本等于家长认为念书没用。

但咫尺且归看,不雅念王人变了。因为钱不好赚了,连开出租车的契机可能王人没了。一代东谈主的期间就变了。

  毕业后,梁文锋没去作念状况员,而是下场作念量化投资,莳植幻方量化。

  他主导的幻方量化在2016年头次上线AI计策,并于2017年终了投资计策全面AI化,成为量化投资领域的调动时尚。

  幻方量化莳植仅6年惩处领域即曾达到千亿,被称为‘量化四大天王’之一。

  亦然国内唯独公开声称有领有万张英伟达A100显卡的企业,其算力储备量就算是在一众互联网公司科技公司里,也豪不失色。

  2023年,梁文锋创立了深度求索(DeepSeek)。

  有音信称,DeepSeek团队不招聘高档技能专科东谈主员。

  职工的工作年限约为3到5年,而那些领有8年以上研发教授的东谈主还可能会被径直拒却。因为他们发怵这样的东谈主背负太重、短少调动的能源。

  梁文锋曾对36氪暗涌说:

  “若是追求短期指标,找现成有教授的东谈主是对的。但若是看长久,教授就没那么迫切,基础才智、创造性、疼爱等更迫切。”

  就像大家不行能猜到,作念游戏显卡的英伟达,临了会成为AI界最迫切的公司。

  大家也不行能猜到,中国AI大模子的但愿,可能就在炒股的公司身上。

  背靠幻方量化的DeepSeek还不差钱。

  梁文锋在2024年暗示,短期内莫得融资谋略,濒临的问题从来不是钱,而是高端芯片被禁运。

  不参与融资,也很少对外发声,闷声去作念AI。

  外界王人认为DeepSeek很奥秘。

  近期“雷军千万年薪挖95后天才AI青娥”的热点话题也障碍地与梁文锋商酌,因为雷军尝试挖走的这位90后青娥罗福莉,此前恰是梁文锋旗下深度求索(DeepSeek)团队的研发成员。

  2024年12月26日,DeepSeek发布了DeepSeek-V3,况且还公开了由梁文锋、罗福莉等东谈主撰写的53页论文《DeepSeek-V3 Technical Report》。

  AI界拼多多

  此前DeepSeek一直被冠以“AI界拼多多”。

  它开启了中国大模子价钱战。

  2024年5月,DeepSeek发布的一款名为DeepSeek V2的开源模子,提供了史无先例的性价比:

推理资本被降到每百万token仅 1块钱,在其时约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。

  随后,字节、腾讯、百度、阿里、kimi等AI公司追随降价。

  梁文锋暗示,我方不是挑升成为一条鲶鱼,仅仅不注意成了一条鲶鱼。没思到价钱让大家这样敏锐。仅仅按照我方的步调来作念事,然后核算资本订价。

  此次新发布的DeepSeek-R1 API 价钱,同样得力。

  DeepSeek-R1 API订价为:每百万输入 tokens 1 元(缓存射中)/ 4 元(缓存未射中),每百万输出 tokens 16 元。

  对比OpenAI o1 的 API 订价:每百万输入 tokens 15 好意思元、每百万输出 tokens 60 好意思元。

  每百万输出订价,大要仅为OpenAI的3.65%。

  DeepSeek极高的性价比,险些是AI大模子界的拼多多。

  DeepSeek还陆续开源到底,放出了背后的参谋论文。

  DeepSeek-R1的推理才智蒸馏到较小的密集模子中,展示了较小模子也不错领有庞杂的推理才智。

  使用Qwen和Llama系列模子进行蒸馏,效能标明蒸馏后的模子在基准测试上发扬优异,举例DeepSeek-R1-Distill-Qwen-14B在AIME 2024上的通过率为69.7%。

  Deepseek不会闭源,他们认为先有一个庞杂的技能生态更迫切。MIT 授权:开脱索要和生意化!

  英伟达的高档参谋科学家Jim Fan(范麟熙)对DeepSeek-R1的评价是:

  咱们生存在这样一个时间:一家非好意思国公司正在让 OpenAI 的初志得以延续——实在绽放、为总共东谈主赋能的前沿参谋。这毫无酷好。最意思的效能才是最有可能的。

  DeepSeek-R1 不仅开源了一系列模子,还公开了总共磨砺诀窍。它们可能是第一个展示 RL 飞轮紧要、抓续增长的 OSS 姿首。

  梁文锋曾精采过,中国AI和好意思国AI的差距。

咱们看到的是中国AI不行能恒久处在追随的位置。咱们通常说中国AI和好意思国有一两年差距,但真是的gap是原创和效法之差。若是这个不改变,中国恒久只但是奴隶者,是以有些探索亦然逃不掉的。

海量资讯、精确解读,尽在新浪财经APP

职责剪辑:何俊熹 九游体育娱乐网

新闻动态

新闻动态

新闻动态

Powered by 九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载 RSS地图 HTML地图


九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载-九游体育娱乐网DeepSeek仍是全面上线了 R1-九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载

回到顶部