当OpenAI还在为每年50亿美金的亏损哭穷时,杭州一家初创公司默默扔出DeepSeek-V3——性能对标GPT-4o,训练成本只要对方3%,堪称AI界的价格屠夫。
昨天,OpenAI联合创始人John Schulman才刚刚官宣离职 Anthropic;今天又被曝出加入了 由前OpenAI首席技术官Mira Murati创立的Thinking Machines Lab 。 初创企业Thinking Machines Lab,已经成功从OpenAI挖来多位重量级研究人员,其中包括: ...
Align-DS-V团队投稿量子位 | 公众号 QbitAI 如果把DeepSeek-R1震撼硅谷的深度推理表现,运用到多模态场景,那会怎样? 此前DeepSeek自家的Janus-Pro-7B没有结合推理能力,但现在,国内有研究团队先做到了—— 基于自研全模态框架Align-Anything,北大联合港科大团队推出多模态版DeepSeek-R1: Align-DS-V,它在部分视觉理解表现评测集 ...
外媒报道指出,29日正值农历新年期间,大多数中国人仍在休假,阿里云发表Qwen2.5-Max的不寻常时机,显示出中国人工智能(AI)新创公司DeepSeek在过去3周急速崛起,不仅对海外竞争对手造成压力,也使其国内对手压力大增。
春节期间,中国的大模型技术迎来了一波密集更新。阿里云通义千问超大规模的MoE模型Qwen2.5-Max正式上线,预训练数据超过20万亿tokens,在多个基准测试中表现优于DeepSeek ...
1月28日,阿里云通义开源视觉模型Qwen2.5-VL,共推出3B、7B和72B三个尺寸版本。据介绍,Qwen2.5-VL不仅擅长识别常见物体,如花、鸟、鱼和昆虫,还能够分析图像中的文本、图表、图标、图形和布局。旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,全面超越GPT-4o与Claude3.5。
1 月 27 日凌晨,阿里云通义重磅开源支持 100 万 Tokens 上下文的 Qwen2.5-1M 模型,推出 7B 及 14B 两个尺寸,均在处理长文本任务中稳定超越 GPT-4o-mini;同时开源推理框架,在处理百万级别长文本输入时可实现近 7 倍的提速。
GPT-o1 有 国内扫码 ⭐⭐⭐⭐⭐ 支持 GPT-4o,内置 MJ 绘图,适合开发者与普通用户 yixiaai.comGPT-4, GPT-o1 有 国内扫码 ⭐⭐⭐⭐⭐ 支持GPT-o1模型 cgn.lify.vipGPT-4, GPT-3.5 有 国内扫码 ⭐⭐⭐⭐ 支持开发者 API,提供长时间服务 总结:如果您希望体验原版 OpenAI 的 ChatGPT ...
GPT-3.5 有 国内邮箱支持 ⭐⭐⭐⭐⭐ 支持 GPT-4o,内置 MJ 绘图,适合开发者与普通用户 gptcat.netGPT-4, GPT-o1, Claude 有 国内邮箱支持 ⭐⭐⭐⭐⭐ 支持GPT-o1模型,一比一还原官网,可以使用实时语音对话,视频对话 ai-panda.xyzGPT-4, GPT-3.5 有 国内邮箱支持 ⭐⭐⭐⭐ 支持 ...
字节跳动正式推出其最新的豆包大模型1.5Pro(Doubao-1.5-pro),这一新模型在多个领域的综合能力上表现出色,成功超越了行业内知名的 GPT-4o 和 Claude3.5Sonnet。该模型的发布标志着字节跳动在人工智能领域又向前迈出了重要一步。 豆包1.5Pro 采用了新型的稀疏 MoE ...
从技术架构的角度来看,豆包大模型显然采用了更高效的训练算法,并依靠更庞大的中文语料库,因此在中文语境下的情感表达能力遥遥领先于其国际竞争对手。这一突破性进展的意义不言而喻:在语音交互的各种场景中,实时性与情感表达成为了推动AI产品从单纯工具走向智能伴侣型态的重要结合点。