数据标注
书号:9787113332440 套系名称:“十五五”普通高等教育人工智能系列教材
作者:张静 刘智国 鞠景会 出版日期:2026-03-01
定价:39.80 页码 / 开本:无 /16
策划编辑:魏娜 责任编辑:闫钇汛 包宁
适用专业:计算机类 适用层次:高等教育
最新印刷时间:2026-03-01
-
本书为“十五五”普通高等教育人工智能系列教材之一,紧扣高等院校人工智能、数据标注等教学需求,同时兼顾相关行业从业人员的技能提升诉求而编写,旨在系统梳理数据标注的核心理论、技术方法与行业规范,构建“理论+实践+案例”的一体化教学体系,助力读者快速掌握数据标注关键技能,推动数据标注行业规范化、专业化发展。全书共七章,主要包括数据标注概述、数据标注分类、图像标注技术与实践、语音标注技术与实践、文本标注技术与实践、3D点云标注技术与实践、数据标注质量检验等内容。 本书系统性强,全面覆盖数据标注的理论、技术、应用与管理,知识体系完整且逻辑严密;实操性突出,融入标准化实操要点与实训任务,注重培养读者的实战能力;适用性广,兼顾各学科教育与各行业数据标注任务需求,内容深浅适宜。 本书适合作为高等院校人工智能、计算机科学与技术、数据科学与大数据技术、电子信息工程等理工类专业教材,也可作为高等院校文史类、艺术类相关专业“数据标注”课程的教材,同时还可供数据标注行业从业人员、人工智能算法工程师与产品经理,以及对数据标注技术感兴趣的广大读者参考使用。
-
在人工智能技术迅猛发展的背景下,数据作为核心生产要素,其质量直接决定算法模型的性能边界。而数据标注作为衔接原始数据与智能模型的关键纽带,已成为人工智能产业链中不可或缺的核心环节。无论是自动驾驶的环境感知、医疗影像的疾病诊断,还是智能语音助手的交互响应、自然语言处理的语义理解,各类智能应用的落地推广与迭代优化,均以高质量标注数据为核心支撑。 本书紧扣高等院校人工智能等专业“数据标注”课程等教学需求,同时兼顾相关行业从业人员的技能提升诉求而编写。全书共七章,内容涵盖数据标注的基础理论、核心技术、质量控制、工具实操等关键维度,形成完整的知识体系闭环。具体而言,第1章为数据标注概述,系统阐释数据标注行业发展脉络、核心价值与应用场景,为后续学习奠定坚实的理论基础;第2章解析图像、语音、文本三大基础数据类型的标注特性与适用场景,搭建系统性知识框架;第3章至第5章聚焦上述三大核心数据类型,深入讲解具体标注技术、操作要点与行业规范,实现理论知识向实操能力的顺畅转化;第6章面向自动驾驶等前沿领域,系统介绍3D点云数据标注技术,有效拓展读者的技术视野与应用边界;第7章构建完整的数据标注质量评估体系,详细说明各类数据标注的质量标准、校验流程与优化方法,为标注成果的质量管控提供有力技术支撑。 本书具有三大核心特色:一是系统性强,全面覆盖数据标注理论、技术、应用与管理,兼顾基础理论与前沿技术,知识体系完整,逻辑脉络严密;二是实操性突出,强化理论与实践的深度融合,聚焦读者实战能力的培养;三是适用性广,兼顾高校教学与行业应用双重需求,内容深浅适度、详略得当。 依托上述特色,本书适合作为高等院校人工智能、计算机科学与技术、数据科学与大数据技术、电子信息工程等理工类专业教材,也可作为高等院校文史类、艺术类相关专业“数据标注”课程的教材,同时还可供数据标注行业从业人员、人工智能算法工程师与产品经理,以及对数据标注技术感兴趣的广大读者参考使用。 全书的实操演示均基于“石家庄学院AI大模型数据标注实训平台”实现,该平台可供使用本书的院校、企业免费使用或本地部署,联系人邮箱为2508008@sjzc.edu.cn。本书配套的PPT课件、习题答案、教学素材等资源可访问中国铁道出版社教育资源数字化平台(https://www.tdpress.com/51eds)进行下载。 本书由石家庄学院张静、刘智国、鞠景会任主编,符蕴芳、郝立宁、聂亚宁、时建峰、袁倩倩、魏冉任副主编。在本书编写过程中,得到了中腾元晟教育科技(河北)有限责任公司的大力支持,多位行业专家也对本书进行了细致审阅并提出宝贵修改意见,在此谨向各方致以衷心的感谢。 鉴于数据标注技术迭代速度较快,加之编者的学术水平与实践经验有限,书中难免存在疏漏与不足之处,恳请广大读者与同行不吝批评指正。 编 者 2025 年 11 月 -
第1章 数据标注概述1 1.1数据标注的起源与发展1 1.1.1人工智能发展与数据标注的关联2 1.1.2数据标注的发展历程2 1.1.3数据标注的介绍4 1.2数据标注的分类5 1.2.1按数据类型分类5 1.2.2按标注精细程度分类8 1.3数据标注的流程9 1.3.1任务规划9 1.3.2数据预处理10 1.3.3标注执行10 1.3.4质量审核11 1.3.5数据交付与存档1 1.4数据标注对AI的核心赋能12 1.4.1有监督机器学习12 1.4.2数据标注员的核心职责、能力与行业价值12 小结13 习题13 实训任务14 第2章 数据标注分类15 2.1图像标注15 2.1.1图像标注概述16 2.1.2图像标注的应用领域18 2.2语音标注22 2.2.1语音标注概述2 2.2.2客服录音数据标注规范23 2.3文本标注25 2.3.1文本标注概述26 2.3.2文本标注应用领域27 小结29 习题29 实训任务29 第3章 图像标注技术与实践30 3.1图像标注基础30 3.1.1图像标注的核心要素30 3.1.2图像标注的技术原理32 3.2图像标注的主要类型与方法3 3.2.1人体拉框33 3.2.2人体抠图36 3.2.32D障碍物标注38 3.2.4交通标志标注53 3.2.5人脸关键点标注55 3.2.6车道线标注59 3.2.7语义分割标注63 3.3图像标注实操6 3.3.1障碍物标注实操66 3.3.2交通标志标注实操69 小结73 习题74 实训任务74 第4章 语音标注技术与实践75 4.1语音标注底层逻辑介绍75 4.1.1语音标注的基本原理76 4.1.2语音标注的要素77 4.1.3语音数据的特点与预处理79 4.2语音标注的主要类型与方法80 4.2.1语音转写标注80 4.2.2情感标注81 4.2.3口音标注81 4.2.4发音标注82 4.2.5说话人识别标注83 4.3语音标注的行业规范与标准84 4.3.1文字错误率的控制标准84 4.3.2标注时间轴精度要求84 4.3.3特殊场景标注规范85 4.4语音标注的典型应用领域85 4.4.1语音标注应用场景86 4.4.2语音标注应用案例介绍87 4.5语音标注实操89 4.5.1语音标注实操界面介绍89 4.5.2语音标注实操步骤89 小结91 习题91 实训任务91 第5章 文本标注技术与实践92 5.1文本标注基础93 5.1.1文本标注的核心要素93 5.1.2文本数据的特点与预处理96 5.2文本标注的主要类型与方法97 5.2.1词性标注98 5.2.2命名实体识别标注98 5.2.3语义角色标注100 5.2.4情感倾向标注101 5.2.5文本分类标注102 5.2.6关系抽取标注102 5.3文本标注的行业规范与标准103 5.3.1标注一致性要求104 5.3.2实体边界标注规范104 5.3.3语义标注标准105 5.4文本标注的典型应用领域106 5.4.1信息检索领域106 5.4.2智能问答领域107 5.4.3机器翻译领域107 5.4.4舆情分析领域108 5.4.5文本摘要领域108 5.5文本标注实操109 5.5.1文本标注要点109 5.5.2文本标注质检要点10 小结111 习题11 实训任务12 第6章 3D点云标注技术与实践13 6.13D点云标注基础13 6.1.13D点云标注的概念114 6.1.23D点云标注对象115 6.1.33D点云标注的范围、属性和要点18 6.23D点云标注的行业规范与标准19 6.2.1标注几何精度与一致性要求120 6.2.2遮挡与截断处理规范120 6.2.3多传感器融合标注标准121 6.33D点云标注的典型应用领域121 6.3.1自动驾驶领域121 6.3.2机器人导航与操作122 6.3.3数字孪生与建筑信息模型123 6.3.4遥感与地质勘探123 6.43D点云平台实操124 6.4.13D点云平台实操界面介绍124 6.4.2自动化与半自动化标注技术127 小结128 习题128 实训任务128 第7章 数据标注质量检验130 7.1数据质量影响算法效果131 7.2数据标注质量标准132 7.2.1图像标注质量标准132 7.2.2语音标注质量标准134 7.2.3文本标注质量标准134 7.3数据标注质量检验方法135 7.3.1实时检验136 7.3.2全样检验137 7.3.3抽样检验138 小结139 习题140 实训任务140
-
张静,副教授,石家庄学院未来信息技术学院实验中心主任。主持“计算思维”课程校级和市级精品课和资源共享课,出版教材《计算机应用与实践》《大学计算机基础与计算思维》《计算思维与信息素养》等,主持多项教改。主持市级项目四项,主持完成“数字资源建设”横向课题,参与一项省自然基金项目和一项河北省重点研发计划项目,出版学术专著《基于高阶有顺序Voronoi图的客体影响范围界定研究》。刘智国,教授,硕士生导师,石家庄学院未来信息技术学院院长。河北省教学名师,河北省物联网区块链融合重点实验室主任,河北省军民融合产学研用示范基地负责人,石家庄市高等学校“专业带头人”。主讲“软件设计模式”“数据结构”等多门课程,主要从事机器视觉方面的研究,发表SCI、EI等期刊论文10篇,授权发明专利15项,出版专著6部、教材4部,获2项河北省教学成果奖。近五年,主持省部级项目4项、横向课题15项,累计经费1000多万元,在研3项工程技术类课题,培养研究生6人。担任中国软件行业协会理事、河北省计算机教育研究会常务理事。鞠景会,博士,工程师,石家庄学院未来信息技术学院教师,长期从事人工智能方面研究,主讲课程“智能数据标注工程与实践”“人工智能应用实践”。参与并主研国家自然科学基金面上重点扶持项目1项,河北省自然科学基金面上项目1项,发表SCIEI论文7篇。
-
(1)系统性强,全面覆盖数据标注理论、技术、应用与管理,兼顾基础理论与前沿技术,知识体系完整,逻辑脉络严密。 (2)实操性突出,强化理论与实践的深度融合,聚焦读者实战能力的培养。 (3)适用性广,兼顾高校教学与行业应用双重需求,内容深浅适度、详略得当。
