(图片来源:钛媒体AGI编辑林志佳拍摄)中国AI模型DeepSeek引发的全球讨论热潮持续近半个月,美国OpenAI公司终于发布新模型对此进行“反击”。北京时间2月1日凌晨,OpenAI CEO奥尔特曼(Sam Altman)在 2 ...
欧洲领先的人工智能公司之一 Mistral AI 推出了一款名为 Mistral Small 3 的新模型。 这是一个包含 240 亿参数的模型,但与 Llama 3.3 70B 和 Qwen 32B 等大型模型相当(至少在 MMLU-Pro ...
(北京31日综合电)中国AI新创公司DeepSeek研发的模型近期受到大量关注,但同时也被OpenAI指控盗用技术。对此,北京《环球时报》前总编辑胡锡进询问了DeepSeek的看法,而Deepseek则回应:“做AI这行谁不是站在巨人肩膀上啊?”胡锡 ...
外媒报道指出,29日正值农历新年期间,大多数中国人仍在休假,阿里云发表Qwen2.5-Max的不寻常时机,显示出中国人工智能(AI)新创公司DeepSeek在过去3周急速崛起,不仅对海外竞争对手造成压力,也使其国内对手压力大增。
春节期间,中国的大模型技术迎来了一波密集更新。阿里云通义千问超大规模的MoE模型Qwen2.5-Max正式上线,预训练数据超过20万亿tokens,在多个基准测试中表现优于DeepSeek ...
1月28日,阿里云通义开源视觉模型Qwen2.5-VL,共推出3B、7B和72B三个尺寸版本。据介绍,Qwen2.5-VL不仅擅长识别常见物体,如花、鸟、鱼和昆虫,还能够分析图像中的文本、图表、图标、图形和布局。旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,全面超越GPT-4o与Claude3.5。
1 月 27 日凌晨,阿里云通义重磅开源支持 100 万 Tokens 上下文的 Qwen2.5-1M 模型,推出 7B 及 14B 两个尺寸,均在处理长文本任务中稳定超越 GPT-4o-mini;同时开源推理框架,在处理百万级别长文本输入时可实现近 7 倍的提速。
更新后,豆包中文场景的对话能力在语音真实感和“喜怒哀乐”的情绪表现上近乎达到“人机难辨”的AI交互效果,可以模仿不同声线,并且在“逻辑思考”和“情绪感知”上有明显提升,其测试效果超过GPT-4o。同时,豆包最新语音模型在中文场景下体现出了 ...
特朗普给予TikTok禁令75天宽限期 美国总统特朗普当地时间20日签署行政令,要求短视频社交媒体平台TikTok“不卖就禁用”法律在未来75天内暂不执行。TikTok在美国的部分服务已恢复,但字节跳动旗下的其他热门应用,如数字卡牌游戏《Marvel Snap》、视频编辑应用CapCut以及社交平台Lemon8,在美仍处于封禁状态。
2025年1月20日,字节跳动在业内引起广泛关注,发布了一款全新的人工智能原生集成开发环境(IDE)——Trae。这款软件目前仅支持MacOS平台,内置了业界领先的人工智能模型Claude-3.5-Sonnet和GPT-4o。Trae的推出,不仅旨在满足编程社区的需求,更是字节跳动对当前AI编程市场趋势的敏锐捕捉。 Trae的设计意在迎合中文用户的使用习惯,提供个性化的体验。与当前市场上的许多ID ...