北京硅基流动科技有限公司
详细介绍
{
“body”: “1. 企业基本情况
北京硅基流动科技有限公司成立于2023年8月29日,总部位于北京市海淀区。公司由前微软亚洲研究院主管研究员、一流科技创始人袁进辉博士创立,是一家专注于AI基础设施(AI Infra)领域的明星创业公司。作为国内领先的大模型云服务平台提供商,硅基流动致力于通过优化大模型推理与部署效率,加速AGI(通用人工智能)的普惠应用,在AI产业链中扮演着连接底层算力与上层应用的关键中间层角色。
2. 企业业务布局
• 整体主营业务:公司整体营收核心业务是提供一站式大模型云服务平台(SiliconCloud)及企业级MaaS(模型即服务)解决方案。通过公有云API服务、专属实例、软件订阅及大模型一体机等多元模式,为开发者和企业客户提供从模型调用到私有化部署的全链路服务。
• 核心 AI 节点识别:该公司最具核心竞争力的细分节点是大模型推理与部署系统,具体技术路线为异构算力纳管下的高性能推理加速。其服务覆盖面包括:1)自研高性能LLM推理引擎SiliconLLM;2)支持英伟达、AMD、昇腾、沐曦、摩尔线程等主流芯片的深度适配与优化;3)提供从模型快速适配、推理部署到场景落地的闭环解决方案。
3. 核心技术与创新能力
聚焦于大模型推理与部署节点,硅基流动的核心技术体现在其自研的推理加速引擎SiliconLLM上。其创新能力包括:1)快速模型适配:针对国产芯片,实现了稠密模型当天上线、MoE架构模型1-2天内适配,较行业平均周期缩短80%以上;2)高性能优化:通过与华为昇腾合作,在CloudMatrix 384超节点上部署DeepSeek-R1,实现了单卡Decode吞吐突破1920 Tokens/s,性能可比肩英伟达H100,且不损失模型精度;3)系统级创新:采用了PD分离(Prefill/Decode分离)、专家并行、分布式KV Cache等复杂机制,以应对大模型推理中的通信与调度挑战。技术壁垒在于其对多种国产异构芯片的深度优化能力,以及构建“模型仓库+推理引擎+运维工具链”一体化架构的工程实践。
4. 市场地位与经营业绩
在大模型推理服务市场,硅基流动凭借对国产算力的深度适配形成了差异化优势。市场地位方面,公司自称是“唯一一家能在国产各种芯片上面实现规模化推理的公司”。其标杆客户以大型央国企和头部互联网公司为主,典型案例包括:服务某头部电力央企实现“百人建模训练、千人Agent开发、万人推理应用”的百千万工程;支持某头部能源企业完成千卡级资源池纳管与行业大模型构建;为某头部智能手机企业部署高并发的DeepSeek-R1服务。经营业绩上,截至2025年9月,平台注册用户超700万,服务企业用户超过1万家,日均生成Token量达上千亿。公司近期完成了密集融资,包括2025年2月由华创资本领投的数亿元Pre-A轮融资,以及2025年6月由阿里云领投的数亿元A轮融资,美团为其战略股东。该板块具体的营收贡献暂无公开披露数据。”
}
主营业务
核心主营业务包括:1. AI基础设施平台建设,提供大语言模型推理引擎SiliconLLM和高性能文生图/视频加速库OneDiff等产品,专注于提升AI算力使用效率;2. 大模型云服务平台SiliconCloud,上线包括阿里巴巴通义千问Qwen3、DeepSeek-R1、V3等上百款主流开源大模型,提供从模型精调、托管到部署的一站式解决方案;3. 一站式异构算力纳管平台,通过弹性算力调度技术实现资源动态扩缩容,有效整合碎片化算力资源,特别完成了国产芯片深度适配,实现国产算力从“可用”到“好用”的突破。
