导言
RL 相关的洞察: 算法趋势、热点模型策略、框架优化、实验规律、流派观点
简介
软件产品的商业成功要点是什么?
Agile Governance: Balancing IPD and AI Innovation
导言
厚重的 IPD 流程 和 AI 创新,如何平衡?
两种范式的对垒
AI 开发的特殊挑战
AI 研发具有高不确定性、高算力成本和极快的技术更迭周期。这导致传统的 IPD 流程在 AI 领域显得过重,而纯粹的敏捷模式在面对大额算力投资时又显得缺乏战略定力。
导言
导言
工作之后,技术其实不是最重要的,如何商业变现才是最重要的(如何多赚钱,持续赚钱,健康增长赚钱),设计好的商业模式是最重要的。
例如,Ascend做什么开源仓,除了考虑社区技术趋势,只要客户买卡,哪怕客户的框架是自娱自乐,我们也会无条件支持。
导言
大语言模型、多模态模型是如何设计来实现高效Mem机制。
导言
QCC(Quality Control Circle, 质量控制小组):由一小群员工组成的团队,定期开会以识别、分析和解决与工作相关的质量问题。起源于日本,广泛应用于制造业、医疗保健和服务行业。
也被用在华为的开发流程中,用于发现问题,分析、设计并解决问题,最后落回版本能力。
导言
DFX:常常是穿刺完功能后,的补充设计和代码重构,
导言
导言
DiffSynth-Studio 是由魔搭社区(ModelScope, 阿里2022年11月开源的模型社区)算法工程师段忠杰主导开发的开源扩散模型引擎,致力于构建统一的 Diffusion 模型生态。该项目支持多种主流文生图/文生视频模型(如 Stable Diffusion、可图、CogVideoX),并兼容 ControlNet、LoRA、IP-Adapter 等生态模型,显著提升中文场景下的生成能力。[^1]
ms-swift[^3]是魔搭社区提供的大模型与多模态大模型微调部署框架,现已支持600+纯文本大模型与300+多模态大模型的训练(预训练、微调、人类对齐)、推理、评测、量化与部署。
除此之外,ms-swift汇集了最新的训练技术,包括集成
ms-swift提供了大模型训练全链路的支持,包括使用