围绕高端装备等行业山东将开展语料库揭榜挂帅项目申报
记者从山东省工信厅了解到,围绕高端装备、烟草制品业、农副食品加工业、家具制造kaiyun开云业、木材加工、皮革毛皮羽毛及其制品和制鞋业、仪器仪表制造业、废弃资源综合利用业等行业,山东将开展语料库揭榜挂帅项目申报,重点推进行业关键数据技术攻关、行业数据语料标准研制、高质量行业语料库打造、语料应用场景落地等。
重点行业语料库揭榜挂帅项目,聚焦工业制造重点行业的基础理论研究、产品研发设计、生产管理运行、过程质量检测等关键环节和特定场景的知识语料汇聚,基于结构化数据(如数据库中的表格数据)、非结构化数据(如文本、图像、语音等)和半结构化数据(如日志文件、XML文件等),通过清洗、去噪和统一格式,用于支持自然语言处理、计算机视觉、机器学习、深度学习等任务,满足行业大模型或场景大模型开发、训练和微调需求的高质量语料库。项目验收时行业相关语料库数据量不低于10万条,具有较高的数据质量、领域覆盖程度、潜在价值和应用成效,项目验收时应通过第三方测评;同时,山东鼓励各行业语料库项目加快语料资源优化整合,积极开放公共语料。
新闻信息服务许可证音像制品出版许可证广播电视节目制作经营许可证网络视听许可证网络文化经营许可证
同类文章排行
- kaiyun的自然语言处理技术有哪些核心功能?
- CV计算机视觉每日开源代码Paper with
- 自然语言处理领域的变革之路:从BERT到Qwen 25
- 人类秒懂AI却懵圈:VLM²-Bench揭示视觉语言模型「视
- AI小程序开发人工智能时代下的商业机遇
- kaiyun公司主要提供哪些计算机视觉和自然语言处理技术服务
- kaiyun的计算机视觉技术可应用于哪些行业场景?
- 如何联系kaiyun中国股份有限公司获取更多技术支持和服务咨
- kaiyun官方如何确保客户数据的安全性?
- 2025-2031年中国机器视觉市场全景调查与未来前景预测

