蚂蚁百灵大模型团队开源 Ring-flash-linear-2.0-128K,适用于超长文本的的代码编程


蚂蚁百灵大模型团队近日正式开源了 ring-flash-linear-2.0-128k 模型,该模型特别适用于超长文本下的代码生成、编程任务以及智能 agent 等复杂应用场景

据悉,该模型采用线性注意力与标准注意力机制相结合的混合架构,在保证高效推理的同时实现了卓越的性能表现。通过融合成熟的 MoE(Mixture of Experts)设计与多项优化技术——包括 1/32 的专家激活比率和 MTP 层结构,Ring-flash-linear 能在仅激活 6.1B 参数的情况下,展现出媲美 40B 全参数密集模型的能力。

蚂蚁百灵大模型团队开源 Ring-flash-linear-2.0-128K,适用于超长文本的的代码编程

此模型基于 Ling-flash-base-2.0 进行转化,并在额外 1T token 数据上进行了持续训练。结合监督微调(SFT)与强化学习的稳定训练策略,模型在各类高难度推理任务中均达到了当前最优(SOTA)水平。

蚂蚁百灵大模型团队开源 Ring-flash-linear-2.0-128K,适用于超长文本的的代码编程

GoEnhance GoEnhance

全能AI视频制作平台:通过GoEnhance AI让视频创作变得比以往任何时候都更简单。

GoEnhance 347 查看详情 GoEnhance

蚂蚁百灵大模型团队开源 Ring-flash-linear-2.0-128K,适用于超长文本的的代码编程

在多项基准测试中,Ring-flash-linear-2.0-128k 不仅表现优于众多现有的开源 MoE 和 Dense 模型,还能与使用标准注意力的 Ring-flash-2.0 模型相匹敌。模型原生支持长达 128K 的上下文长度,并可通过 YaRN 技术扩展至 512K,显著提升了对极长输入输出序列的处理速度与准确性。

Huggingface: https://www.php.cn/link/b78f81d5bdfed3168c472b237f37b43a Modelscope: https://www.php.cn/link/c5fb163f824e9eeed5086689a8a905d9 GitHub linghe 算子库: https://www.php.cn/link/af8e3c349612f1af5aa0509b16bae3cc

以上就是蚂蚁百灵大模型团队开源 Ring-flash-linear-2.0-128K,适用于超长文本的的代码编程的详细内容,更多请关注其它相关文章!


# 中文网  # seo纸尿裤  # 南通安阳网站优化  # 新疆设计院网站建设  # 祝福网站建设路  # 网站如何营销产品推广  # 推广粤语歌曲的网站  # 网站题目怎么优化  # 黄山营销推广如何投放  # 网站页面标题优化策略  # 泉州高端网站建设  # 解决问题  # git  # 达到了  # 相关文章  # 能在  # 并在  # 成长之路  # 多项  # 适用于  # 开源  # 大模型  # ai  # github 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: ChatGPT只讲这25个笑话!实验上千次有90%重复,网友:幽默是人类最后的尊严  英伟达推出 L40S GPU,AI 推理性能超过 A100 约 1.2 倍  特斯拉门店可能启动机器人卖车?也许不是你想的那样  掌阅科技申请阅爱聊商标 掌阅科技申请AI相关商标  数据显示:人工智能相关专业热度上升最快 考古、美术、生物医学工程等小众专业火了  Zoom远程会议应用:AI培训需经用户授权  山东机器人编程:Scratch编程基础,认识舞台!~济南机器人编程  PS AI修图免费平替来了!Stability AI又放大招,核弹级更新一键扩图  WHEE网页地址入口  如何用户外电源给无人机实现持久续航  「模仿学习」只会套话?解释微调+130亿参数Orca:推理能力打平ChatGPT  全球首款AI裸眼3D平板 国产的售价破万  Snow Kylin登陆中国列车,打造全球首条元宇宙专列  美图影像节演讲实录:191次提及AI,发布7款影像生产力工具  马斯克发推讽刺人工智能,机器学习本质是统计?  上新7款产品,美图继续“蹭”AI  学界业界大咖探讨:AI对数字艺术创新的推动力  报告称 70% 程序员已使用各种 AI 工具编程  给小朋友最好的科技礼物:乐天派桌面机器人  如何用Transformer BEV克服自动驾驶的极端情况?  OpenAI宣布组建新团队 以控制“超级智能”人工智能  AI取代人工先拿教育行业开刀?美版“作业帮”启动裁员  消息称字节机器人团队已有约50人,计划年底扩充到上百人  AI大模型产品集体奔赴高考考场,教育赛道的讯飞星火能赢吗?  阿里达摩院向公众免费开放100项AI专利许可  AI 冥想应用 Ogimi.ai 推出,可为用户提供教练级个性化指导  改动一行代码,PyTorch训练三倍提速,这些「高级技术」是关键  马斯克嘲讽人工智能:机器学习本质就是统计学  美图设计室2.0新增哪些功能  人工智能助力林草行业高质量发展  人工智能和你聊天 成本有多高  放弃自动驾驶,也是一种和解  发布最新版本的 PICO OS 5.7.0:支持VR头盔录屏并跨平台分享至微信  复旦发布「新闻推荐生态系统模拟器」SimuLine:单机支持万名读者、千名创作者、100+轮次推荐  6月14日《星空下的对话》 张朝阳陆川将畅聊人生、电影、心理学与AI  谷歌在人工智能领域没有“护城河”?  马斯克预测:特斯拉全自动驾驶将在今年实现 对AI深度变化感到担忧  优地网络助力新媒体拥抱人工智能时代  杭州举办第19届亚运会,主题为「亚运元宇宙」的发布仪式举行  业内领先 四川大学华西第四医院甲状腺乳腺外科成功进入手术机器人时代  人工智能大胆预测:银河系至少有2万个地球,36种外星文明  特斯拉人形机器人将亮相 预计售价不超过15万元  稿见AI助手:提升写作效率与质量的必备工具  腾讯企点客服接待与营销分析能力升级!企业操作更高效、人机交互更智能  创作音乐/音频的Meta开源AI工具AudioCraft,让用户通过文本提示实现  世界人工智能大会中西部县域数字就业中心组团亮相  Hugging Face发布了基于NASA卫星数据构建的AI地理空间基础模型  传Meta 2025年推出首款AR眼镜,采用军用级别材料,计划生产1000台  日新月异,脑机接口技术都有哪些新应用?  IBM CEO克里希纳:人工智能潜在创新无法被监管 

 2025-10-28

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.