AI数据治理
概述
本课题组聚焦人工智能全周期中的数据治理与合规治理,致力于构建“模型-数据-治理”三元协同的新范式,推动AI在释放潜能的同时实现可信可控发展,服务国家数字战略与智能治理体系建设。
招生对象
仅限硕士研究生
协调人
黄建华,教授 (数据科学学院&人工智能学院)
成员
陈荣富,教授 (数据科学学院)
George POLYZOS,教授 (数据科学学院)
黄建华,教授 (数据科学学院&人工智能学院)
黄平,副教授 (公共政策学院)
肖蕴明,助理教授 (数据科学学院)
| 研究领域 |
本研究组聚焦AI与数据的交叉融合,同时关注其治理维度,近期的重点子方向如下:
AI大模型语料数据全链路管理平台与工具链
AI增强的新型数据集成系统与治理框架
AI时代的科技伦理、产业政策与治理体系
| 研究愿景与目标 |
本研究组紧密围绕国家在数字经济与人工智能领域的战略布局,以构建“数据驱动、智能赋能、治理有序”的新一代信息基础设施为核心使命,致力于系统解决人工智能全生命周期中的数据供给、价值融合与合规治理的基础性、关键性问题,推动AI发展范式从以模型为中心,向“模型-数据-治理”三元协同演进,确保人工智能在高效释放潜能的同时,具备可信可控、合规负责的发展特质,实现技术创新与风险治理的有机统一。
三个重点子方向的研究愿景与目标如下:
AI大模型语料数据全链路管理平台与工具链:
打造面向大模型全生命周期的高品质数据供应链体系,实现从原始数据到模型知识的可追溯、可评估、可演进的精细化管理。重点研发集成多模态数据溯源、质量量化、偏见检测、版权合规与毒性过滤等的全链路工具链。建立语料数据的效能评估指标体系,量化数据对模型性能(如领域能力、安全对齐)的贡献度。探索数据配比优化与合成数据生成等关键技术,实现高效、低成本、可控的数据供给。AI增强的新型数据集成系统与治理框架:
构建具备“智能认知”能力的新一代数据基础设施,破解“数据孤岛”困境,实现跨源、异构数据的语义级理解与安全可控的融合利用。重点研究基于AI的自动化数据语义发现与映射技术,设计融合数据编织、数据空间、数据网格等理念的体系架构,集成隐私计算、策略驱动访问/使用控制与可信执行环境等关键技术,形成支撑数据“可用不可见、可控可溯可计量”流通与协同计算的治理框架。AI时代的科技伦理、产业政策与治理体系:
针对AI技术快速迭代与深远的经济社会影响,构建适应性强、前瞻引领的科技伦理、产业政策与综合治理体系。重点建立可量化、可操作的AI风险评估与效益分析模型,支撑分级分类监管与政策实验;研究关键领域(如算力、数据)的产业政策与供应链战略;推动形成符合国情、衔接国际的治理框架,包括标准规范、安全审计、伦理审查与跨境协同机制。
招生要求:
AI大模型语料数据全链路管理平台与工具链:
目标学生背景: 以计算机科学、数据科学、人工智能等理工科本科毕业生为主。
招生要求:
1.理论知识:
o 必修:数据结构、算法、线性代数、概率论与数理统计、数据库系统。
o 具备以下一项或多项知识者优先:大模型原理与应用、自然语言处理、机器学习、数据工程、大数据技术与应用。
2.实践能力:
o 编程能力: 熟练掌握Python与Java编程语言,熟悉Linux开发环境。
o 软件设计与开发: 具备扎实的软件工程基础,有参与实际项目(如课程设计、开源项目、商用软件等)的经验者优先。
o 洞察分析: 对AI大模型全生命周期中各个环节的数据处理与使用有基本认知,能够分析其中的痛点与需求。
o 科研能力: 具备良好的技术文档阅读和撰写能力,有较强的逻辑思维和学习能力。
3.实习经历:
o 在互联网公司、数据服务企业、AI大模型开发与应用企业从事过数据处理、平台软件或算法开发、AI大模型训练、AI大模型应用开发的相关实习者优先。- AI增强的新型数据集成系统与治理框架:
目标学生背景: 以计算机科学、信息管理系统、数据科学、信息安全等理工科本科毕业生为主。
招生要求:
1.理论知识:
o 必修:数据库系统、计算机网络、分布式系统、算法。
o 具备以下一项或多项知识者优先:数据仓库与数据湖、知识图谱、数据治理、数据工程、信息安全。
2.实践能力:
o 编程能力: 熟练掌握Java与Python,有使用SQL和NoSQL数据库的经验。
o 软件设计与开发: 对系统架构设计有浓厚兴趣,具备良好的抽象思维和系统建模能力。
o 洞察分析: 能够理解复杂业务场景下的数据集成挑战,对数据隐私、安全和治理敏感。
o 科研能力: 具备清晰的技术表达能力和方案设计能力,有志于解决高复杂度的系统工程问题。
3.实习经历:
o 有企业级软件开发、数据中台建设、数据治理、AI大模型语料数据处理、AI大模型应用开发的相关实习经验者优先。 - AI时代的科技伦理、产业政策与治理体系:
目标学生背景:具备一定的计算机学科基础知识的公共管理、法学、社会学、经济学等文科本科毕业生,或者对科技产业政策与AI治理有浓厚兴趣且具备一定的社科学科基础知识的理工科本科毕业生。
招生要求:
1.理论知识:
o 必修:社会科学研究方法、计算机基础、高等数学、数理统计基础。
o 具备以下一项或多项知识者优先:公共政策分析、法学基础、科技与社会、经济学原理、伦理学、人工智能概论、大数据应用、数据治理。
2.实践能力:
o 洞察分析: 对人工智能技术的多维度影响有敏锐的洞察力,具备较强的逻辑分析和批判性思维能力。
o 科研报告/论文撰写: 具备优秀的中英文书面表达能力,能够进行严谨的文献综述和政策研究,有独立撰写研究报告或学术论文的经验者优先。
o 软件使用与编程: 编程能力不作强制要求,但鼓励具备基础的数据分析技能与相关软件的操作使用技巧。
3.实习经历:
o 在政府研究部门、智库、科技公司公共政策岗位、NGO或媒体科技版块有过实习或项目经验者优先。


