元景思维链大模型作为中国联通推出的业界 首款 央企开源通用思维链大模型,展现了强大的慢思考能力和多学科、多场景的通用推理能力。它不仅能够针对不同任务和难度进行自适应慢思考,还显著降低了资源消耗,展现出卓越的性能表现。
在人工智能领域,技术的发展总是令人瞩目的。近日,由量化私募幻方量化旗下的AI初创公司DeepSeek发布的开放源代码模型DeepSeek ...
近期,豆包大模型迎来了其1.5 Pro版本的正式亮相,这一消息在业界引起了广泛关注。
1月20日消息,据报道,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。
在人工智能技术不断发展的今天,字节跳动最新推出的豆包大模型1.5 Pro版本引发了行业广泛关注。这款模型在知识、代码推理及中文处理等多个关键领域的测评成绩,均超越了业界知名对手如GPT-4o和Claude 3.5 ...
在瞬息万变的人工智能领域,vLLM的飞速增长引发了广泛关注。2024年下半年,vLLM成功实现了其GPU使用时长竟然十倍增长的惊人表现,相当于持续运转的8.5万台GPU,这不仅显示了该推理引擎的实力,更体现了其在开源AI生态系统中的核心地位。
字节团队告诉 APPSO,Doubao-1.5-pro 目前已经在豆包 APP 灰度上线,由于对话是先接意图识别,所以用户大概率没法确定在使用时是否分流到 1.5 Pro,不过开发者也可在火山引擎直接调用 API。
目前现有的长上下文语言模型(long-context language models)的评估基准主要集中在长上下文回忆任务上,这些任务要求模型在处理大量无关信息的同时生成简短的响应,没有充分评估模型在整合分散信息和生成长输出方面的能力。
在具体技术方案上,MiniMax-01系列模型的参数量高达4560亿,其中每次激活幅度达到459亿。这种架构创新意味着通过线性复杂度模型,AI可以有效地处理超长文本输入,而不至于延迟响应或丧失上下文信息。此外,模型还采用了混合专家机制(MoE)和高效 ...
每经AI快讯,北京时间1月20日11时54分,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。(界面) 每日经济新闻 ...
全新的豆包实时语音模型Doubao-1.5-realtime-voice-pro,采用Speech2Speech端到端框架,表现力实现质的飞跃,真正做到会哭会笑、能说方言会唱歌。该模型已在豆包App全量上线。
1月16日,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型;在识别推理错误步骤能力上,Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。同时,通义团队 ...