知满科技发布中文半导体大模型生态:ZhimanSemi
ZhimanSemi生态:构建中国半导体行业的AI新基建,为中国半导体企业提供“算力 + 模型 + 数据 + 应用 + 能力”的全套方案。
在全球半导体竞争加剧的背景下,中国半导体行业正遭遇“人才与知识双流失”:资深专家加速退休导致宝贵经验难以传承,高薪跳槽与激烈竞争也使企业难以留住核心技术知识,大量文档与手册散落无序,难以利用。与此同时,企业在降本增效、缩短研发周期的需求下,大模型的学习与推理能力正成为破局关键,既能充当“永不退休的老专家”并培养新工程师,也能支撑行业整体升级。
为此,知满科技于2024年4月率先发布了适应中国半导体产业特点的行业大模型生态——ZhimanSemi。短短4个月内,即在国内半导体龙头企业实现规模化,大幅提升研发与生产效率,如工艺标准查询、研发计算推理和科研技术解读,分别实现了10倍、12倍和90倍的效率提升。整体而言,新工程师的学习曲线加速了70%,新技术的迭代周期预计可缩短25-35%,极大提升了研发效率和技术创新能力。
这是专为半导体行业打造的中文半导体大模型,旨在帮助企业加速AI化转型,留住专业知识并赋能新工程师快速成长,构建适合中国半导体产业的AI新基建。
一、通用模型和行业模型的局限性
随着AI技术在各行各业普及,半导体领域也尝试将通用模型或行业模型应用于复杂工艺场景。然而,通用模型与一般行业模型在面对严苛的半导体工艺要求与企业独家配方时,都显得力不从心。
- 通用大模型专业度不足
通用模型并未针对半导体工艺、设备和参数进行专门优化,容易出现不准确或甚至错误的建议,影响生产和研发安全。 - 行业模型缺少企业特有知识
一般行业模型只涵盖行业通用数据,难以针对企业独有的配方比例、设备配置、工艺要点提供定制化指导。 - 模型“幻觉”与高验证成本
无论通用还是通用行业模型,均可能生成看似合理却实则错误的答案,工程师需反复验证,最终徒增时间成本。
二、ZhimanSemi生态的核心优势
为了解决上述痛点,知满科技推出针对半导体行业的ZhimanSemi生态,从专业、准确、可控、自主、和安全五个维度,帮助半导体企业在安全、可控的环境下完成专业级AI化转型。
- 专业:国内半导体领域首个专用大型语言模型
ZhimanSemi针对半导体工艺、设备、配方、生产流程等方面进行了精细化训练,在覆盖先进制程和成熟制程数据的同时,也结合了海量中文语料和中文基座模型,使其在中文沟通中能力更强。 - 准确:AI搜索与模型理解推理结合,杜绝“幻觉”问题
ZhimanSemi在底层结合了RAG、Hybrid Search、Rerank与RBCA等技术,让每个回答都能追溯到企业内部原文档数据,确保答案的可信度。与传统的“黑盒”模型相比,可为严肃生产场景提供“有源可溯”的证据链,避免了模型“幻觉”可能带来生产事故。 - 可控:RAG结合RBCA,彻底盘活企业文档
企业可按照部门、研究小组等不同层级对文档进行分类管理,方便后续训练和检索的同时,也确保跨部门数据不会互相泄露,在满足合规与保密要求的前提下,实现知识的有效共享与应用。 - 自主:标准化模型训练平台,实现企业大模型自主可控
每家企业的生产环境、设备配方、工艺流程都独一无二,ZhimanSemi的模型训练平台可给行业模型做“入职培训”。企业无需深厚的AI背景,也能快速用自己的数据微调模型,从而拥有自主可控的企业“数字工程师”。 - 安全:隐私安全保障,可本地私有化部署
半导体行业对数据安全有高标准。ZhimanSemi可在本地私有化环境中完成数据处理、模型训练与推理,采用推训一体机将敏感数据与外部网络物理隔离,全面消除信息外泄风险。
三、真实案例
在国内半导体龙头企业的实际应用中,ZhimanSemi通过加速技术沉淀、缩短研发周期、降低人工查询成本等方式,使新工程师的学习曲线加速了70%,新技术的迭代周期预计可缩短25-35%,极大提升了研发效率和技术创新能力。
- 半导体工艺标准查询:由10分钟缩短至1分钟,提效10倍。
- 研发计算推理:原本需2小时的计算与验证,如今10分钟完成,提效12倍。
- 机台设备维修:4分钟查资料减至15秒,效率提升16倍。
- 科研论文解读:1.5天缩短至10分钟,提效90倍。
这些实际场景证明,ZhimanSemi大幅缩短了工程师查阅、验证与推理的工作时长,让企业聚焦高价值创新。
四、ZhimanSemi生态是什么
ZhimanSemi生态是一套“算力+模型+数据+应用+能力”的全维度解决方案。其核心价值是帮助中国半导体企业建立一套真正自主可控、与实际生产深度结合的企业级大模型生态。
- 算力层-推训一体机:8卡4090、8卡L20等多种配置可选,满足从中小规模到高性能计算的多层次需求。
- 模型层-ZhimanSemi半导体模型矩阵:
- ZhimanSemi-Chat:专家对话型推理模型,支持高效知识查询和研发推理。
- ZhimanSemi-OnDevice:端侧推理模型,在设备端的本地推理,实现机台设备的预测性维护。
- ZhimanSemi-Code:代码生成与优化模型,生成符合企业独有标准的设备控制代码。
- ZhimanSemi-VL:缺陷检测多模态模型,包含30多种缺陷类型、3万张晶圆图像的视觉识别模型。
- 数据层-半导体知识集:不仅包含大量中文半导体语料和行业专业资料,还涵盖了领先的制程技术与成熟制程工艺数据,为模型在中国市场的适应性奠定基础。
- 应用层-企业级AI搜索平台:提供内置的问答与文件溯源功能,使工程师和科研人员能够快速调用企业内的各类操作手册、维修issue库与标准查询库等。
- 能力层-模型训练平台:为企业提供一套标准易用的模型训练平台,以及配套的模版和指导,让企业拥有微调模型的能力,在自主可控的环境下生成更多“企业模型”和“场景模型”。
五、半导体行业模型的研发标准
为了保证半导体大模型的准确性和实用性,知满科技建立了一套严格的研发与评估流程,从数据采集到专家审查再到微调部署,层层把关。
- 行业数据搜集
特别强化中文半导体语料,同时融合先进及成熟制程数据;通过QA指令细化蚀刻、光刻等关键工艺。 - 专家审查与标准化标注
领域专家对模型输出进行审查与打分,不断迭代评分标准,确保精确性。 - 多阶段微调
- 预训练:基于Qwen基础模型注入半导体领域核心文本。
- SFT微调:利用专业数据进行定向训练,让模型拥有更强的实际生产适配力。
- 后处理量化:通过GPTQ和LoRA合并等技术进一步压缩模型体积,方便本地化部署。
六、未来研究方向
目前,知满科技专注于完成半导体行业模型的构建,并为企业专用模型的转型奠定基础。随着模型的成熟,知满科技引导半导体企业建设AI基础设施,构建知识库并进行定制化“入职培训”,实现从通用模型到企业专用模型的精准过渡。
未来,知满科技将深化行业模型与企业需求的结合,通过精准微调和本地化训练,提升模型在特定场景下的适应能力。同时,加强合作,完善AI基础设施,提供便捷工具,确保数据安全,推动智能化生产与决策的全面落地。最终,助力中国半导体企业构建自主可控的AI生态系统,提升技术水平和创新能力,实现全球竞争中的可持续发展。
封面海报@知满AI
PR稿修订@知满AI