资讯

划重点: 1、HonestAGI团队发布一项名为“模型指纹”的研究欲证明华为盘古大模型抄袭阿里Qwen,但由于方法过于简单粗暴、团队和参考文献存在造假嫌疑被质疑其真实性。 2、在华为诺亚方舟实验室官方做出回应之后,一位自称内部员工人士发 ...
2025年6月30日,华为正式宣布开源盘古7B参数的稠密模型、盘古Pro MoE 72B混合专家模型和基于昇腾的模型推理技术。随后一项由@HonestAGI 发布于GitHub的针对盘古大模型的研究引发业界热议,该研究的作者认为,华为推 ...
据《财经》报道,多家科技企业已关注此事进展,未来或推动建立更清晰的开源协议细则。华为云数据显示,盘古大模型已在30余个行业、400余个场景落地,此次争议或加速行业对开源协作规范的重视。
在2025年,Qwen公司推出了其最新的图像生成技术——Qwen VLo。这一技术在Vision-Language(VL)系列的基础上进行了重大升级,增加了图像输出能力,标志着AI在创作领域的又一次突破。Qwen ...
作者|沐风来源|AI先锋官近日,华为宣布开源其盘古大模型核心组件(PanguProMoE),包括70亿参数稠密模型和720亿参数的混合专家模型,并高调宣称“昇腾生态迈出关键一步”。但谁也没料到,就在4天后,来自GitHub用户@HonestAGI发布的一份技术报告,将华为盘古大模型推入了巨大的争议漩涡。该研究团队通过“LLM指纹技术”分 ...
在人工智能领域, 大型语言模型(LLM)的研究不断推进,近期,上海交通大学的研究人员对LLM中的强化学习(RL)技术进行了深入探讨,尤其聚焦于Qwen 和 Llama 系列模型的差异,以及新推出的 OctoThinker 模型。
目前模型人人免费可玩(当前为预览版),具体请认准Qwen3-235B-A22B,直接在首页输入框提需求就行。 根据Qwen介绍的亮点,即“强细节捕捉”和“一句话编辑图像”,我们着重在测试中考查了Qwen-VLo的 各种编辑能力 。
IT之家 6 月 27 日消息,阿里云通义千问刚刚发文,宣布推出最新的 Qwen VLo—— 一个多模态统一理解与生成模型,用户可以通过 Qwen Chat( chat.qwen.ai )进行体验。
华为方面指出,用同为通义千问系的不同版本模型进行指纹对比,同样能得出高相关性,试图以此稀释其与盘古模型高相关性的指控效力。此外,华为强调盘古与通义在 词表(tokenizer)和部分配置文件上存在不同 。
此外,研究团队也尝试通过从常见数学问题求解数据集中引入长链式思维数据来扩充正例种子集合,以提升分类器召回推理密集型内容的能力。然而,这种方法最终仅保留了约 20B tokens,研究团队认为其规模不足,因此未被采用。
上一代Qwen的类似产品是Qwen-VL系列,就是Vision-Language,拥有看图片和文字的能力,这次的模型后面加了一个o,变成了Qwen-VLo,我猜测是output的意思,也就是VLo = Vision-Language-Output。这一点儿很容易理解,VL只能够理解输入,而VLo是可以输出的,也就是图片输出功能。这次的更新最大的亮点就在于这句话:Qwen VLo ...