近期,豆包大模型迎来了其1.5 Pro版本的正式亮相,这一消息在业界引起了广泛关注。
在人工智能领域,技术的发展总是令人瞩目的。近日,由量化私募幻方量化旗下的AI初创公司DeepSeek发布的开放源代码模型DeepSeek ...
1月20日消息,据报道,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。
1月20日,钛媒体App报道,OpenAI官方发布了一份事故报告,坦言其GPT-4o及4o-mini模型当前正面临性能下降的严峻考验。这一信息无疑引发了科技圈的广泛关注与讨论,究竟是什么原因导致这些领先的人工智能模型出现问题?
在瞬息万变的人工智能领域,vLLM的飞速增长引发了广泛关注。2024年下半年,vLLM成功实现了其GPU使用时长竟然十倍增长的惊人表现,相当于持续运转的8.5万台GPU,这不仅显示了该推理引擎的实力,更体现了其在开源AI生态系统中的核心地位。
字节跳动近日正式推出了其最新的豆包大模型1.5 Pro版本,这一消息引起了业界的广泛关注。据悉,该模型在知识、代码、推理以及中文等多个关键测评领域,均展现出了超越GPT-4o、Claude 3.5 Sonnet等竞争对手的实力。
字节团队告诉 APPSO,Doubao-1.5-pro 目前已经在豆包 APP 灰度上线,由于对话是先接意图识别,所以用户大概率没法确定在使用时是否分流到 1.5 Pro,不过开发者也可在火山引擎直接调用 API。
目前现有的长上下文语言模型(long-context language models)的评估基准主要集中在长上下文回忆任务上,这些任务要求模型在处理大量无关信息的同时生成简短的响应,没有充分评估模型在整合分散信息和生成长输出方面的能力。
在具体技术方案上,MiniMax-01系列模型的参数量高达4560亿,其中每次激活幅度达到459亿。这种架构创新意味着通过线性复杂度模型,AI可以有效地处理超长文本输入,而不至于延迟响应或丧失上下文信息。此外,模型还采用了混合专家机制(MoE)和高效 ...
全新的豆包实时语音模型Doubao-1.5-realtime-voice-pro,采用Speech2Speech端到端框架,表现力实现质的飞跃,真正做到会哭会笑、能说方言会唱歌。该模型已在豆包App全量上线。
微软探讨大型语言模型在医疗领域错误检测与修正的应用,并推出了名为MEDEC的全新基准测试集。然而,这篇论文同时也估计了市面上多个商业模型的规模,研究团队认为OpenAI GPT-4o-mini仅约80亿参数,远小于外界先前的预期。
1月16日,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型;在识别推理错误步骤能力上,Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。同时,通义团队 ...