IT之家 2 月 12 日消息,AI 搜索引擎企业 Perplexity 当地时间昨日宣布推出其开发的新版 Sonar 搜索模型。该模型 由 Llama 3.3 70B 进一步训练而来,对搜索应用进行了优化 ,运行在 Cerebras 推理基础设施上。
巴克莱分析师指出,DeepSeek新推出的R1模型在数学和编程任务方面已达到与OpenAI o1模型相当的性能水平,超越了Anthropic的Claude 3.5 Sonnet。
招银国际此前指出,2025年AI应用在手机端落地,将进一步驱动换机周期,预计2025年智能手机出货量将同比增长3%至12.5亿台。考虑到AI手机在光学/声学、电源、散热和折叠屏等方面创新,预计将持续推动零部件规格升级。国内供应链在全球份额提升、竞争趋缓、降本增效等因素带动下盈利能力有望持续改善。
47 分钟
每日经济新闻 on MSN阿里巴巴大涨超5%,最新发布Qwen2.5-Max为非推理类的中国大模型冠军2月12日早盘,港股三大指数集体高开,恒生指数涨1.09%,报21526.41点,恒生科指涨1.4%,国企指数涨1.16%。主流ETF方面,恒生科技指数ETF(513180)跟随指数上扬,持仓股中,金蝶国际、阿里巴巴、舜宇光学科技、联想集团、中芯国际 ...
DeepSeek-V3在训练过程中采用了多token预测(MTP)技术,这一创新显著提升了模型的生成速度和性能。传统的语言模型通常只预测下一个token,而DeepSeek-V3则在每个位置上预测多个未来token。通过这种方法,模型不仅增加了训练信 ...
概括而言,通过对Claude平台 400万+匿名对话数据 的分析,Anthropic构建起了衡量AI在经济活动中使用模式的框架,以此揭示AI在不同任务、职业中的应用情况,并最终探讨了其对经济的影响。 展开来说,如下图框架所示,研究团队使用Clio工具 ...
去年2月下旬,英伟达CEO黄仁勋接受美国科技媒体Wired采访时说:“英伟达今天的业务可能是40%的推理和60%的训练,这是一件好事,因为这让你意识到AI终于成功了。如果英伟达的业务是90%的训练和10%的推理,你可以说AI仍处于早期研究阶段。” ...
与此同时,特朗普的政策提议为经济前景增加了不确定性,可能会引发美联储主席的质询。特朗普政府已提高对中国商品的关税,威胁对加拿大和墨西哥征收额外关税,以及对所有钢铁和铝进口产品征税,并启动了承诺的移民打击行动。
就在最近,谷歌 DeepMind 围绕 DeepSeek 模型成果及其低成本所发表的看法再一次受到关注与热议。2 月 9 日,谷歌 DeepMind 首席执行官 Demis Hassabis 在一场活动上表示,DeepSeek 的人工智能模型 ...
Video-MMMU的独特之处在于首次将视频作为知识传播的核心渠道,从传统的视频场景理解转向视频内容的知识学习。数据集专注于高质量教育视频,平均时长506.2秒,覆盖多个学科领域。其问题平均长度达75.7字,远超其他基准,体现出高度专业性和挑战性。
今日港股开盘后,阿里股价一度上涨触及108.6港元,之后回落,截至收盘股价下跌0.57%。从年初至今来看,阿里股价已整体上涨约27%。2024年,阿里在完成换帅并年内累计投入160亿美元(约人民币1168亿元)用于股份回购后,阿里的股价上升了10%,而2021年、2022年、2023年,阿里的股价则分别下跌了约48%、19%和11%。 有业内分析认为,DeepSeek再次显著激发了国际投资者对中国 ...
DeepSeek大模型版本陆续迭代,低成本高性能优势明显。据报道,2023年11月2日,DeepSeek推出首个模型DeepSeek Coder,该模型免费供商业使用且完全开源。2023年11月29日,DeepSeek ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果