知识图谱与大型语言模型
概述
本课题组致力于融合知识图谱与大型语言模型,将工业与软件工程领域的碎片化多模态数据转化为可计算的结构化知识,旨在构建下一代智能系统的“知识大脑”,赋能工业智能与软件工程的跨越式发展。
招生对象
仅限硕士研究生
协调人
陈靖邦,研究助理教授 (数据科学学院)
成员
陈靖邦,研究助理教授 (数据科学学院)
黄建华,教授 (数据科学学院&人工智能学院)
曾立 (深圳大数据研究院)
| 研究领域 |
1.工业级知识图谱的自动构建与演化
2.基于图结构的多智能体记忆与协作
3.基于图索引的混合增强检索
| 研究愿景与目标 |
一、研究背景与使命
在人工智能迈向认知智能的关键阶段,我们面临着“数据海量但知识匮乏”的核心挑战。工业与软件工程领域沉淀了海量的文档、设计图、代码、日志与对话等碎片化信息,它们是无法被机器直接理解和推理的“数据暗物质”。本课题组的核心使命,正是致力于破解这一瓶颈,通过知识图谱与大型语言模型的深度融合,将碎片化的多模态数据转化为结构化的可计算知识,构建下一代智能系统的“知识大脑”,最终赋能工业智能化与软件工程自动化的跨越式发展。
二、核心研究方向
我们的研究围绕“知识图谱”与“大语言模型”这两大支柱技术的协同与互促展开,具体聚焦于以下三个前沿方向:
1.工业级知识图谱的自动构建与演化
研究如何利用LLM的强大语义理解与生成能力,从非结构化的工业文档、设计图纸、源代码乃至传感器日志中,自动化地抽取实体、关系与属性,解决传统方法在领域适配、语义模糊和冷启动上的难题。重点研究多模态知识融合、低资源场景下的信息抽取、以及知识图谱的动态更新与质量保障机制。
2.基于图结构的多智能体记忆与协作
探索将知识图谱作为多智能体系统的共享记忆体与世界观。研究如何利用图结构来存储、组织和关联智能体在交互中产生的经验与知识,实现长期记忆、知识共享与逻辑推理,从而解决智能体在复杂任务中的上下文遗忘、协作低效与策略短视等问题,迈向更智能、更协同的AI Agent系统。
3.基于图索引的混合增强检索
针对纯向量检索在精确性、可解释性和复杂推理上的不足,深入研究“图索引 + 向量嵌入”的混合检索新范式。利用知识图谱固有的语义网络和逻辑路径,为LLM提供精准、可溯源且富含逻辑关系的上下文信息,显著提升其在领域问答、代码生成和决策支持等任务中的准确性、可靠性与透明度。
三、 对学生培养目标
我们致力于培养在人工智能、知识工程与软件工程交叉领域具备顶尖竞争力的复合型研究与工程人才。通过本课题组的系统训练,学生将:
1. 掌握核心技术栈: 精通大型语言模型的原理、微调与应用,掌握知识图谱从构建、存储、推理到应用的全链路核心技术。
2. 塑造系统化科研能力: 培养从发现问题、文献综述、技术选型、实验设计到论文写作与系统实现的完整科研闭环能力。
3. 强化工程与实践能力: 在真实的工业场景与数据中锤炼解决复杂问题的能力,具备设计、实现并部署高可用、可扩展的AI系统原型的能力。
4. 培育跨界创新思维: 形成在“数据-信息-知识-智能”价值链上进行系统性思考和创新的思维模式。
四、 职业前景
本方向培养的学生站在AI技术应用的最前沿,具备的知识结构与技术能力高度契合当前产业界对高端AI人才的迫切需求,职业前景广阔且极具竞争力:
●核心就业方向:
○互联网大厂: 进入阿里巴巴、腾讯、百度、字节跳动等公司,担任高级算法工程师/科学家,从事智能搜索、推荐系统、知识图谱、大模型Agent等核心业务的研发。
○工业软件与智能制造: 加入华为、西门子、宝信软件等企业,从事工业智能、数字孪生、智能研发等领域的知识图谱平台与AI系统构建。
○金融科技与自动驾驶: 在顶尖金融机构或自动驾驶公司,负责风控知识图谱、事理图谱构建、车载语义理解等关键任务。
○顶尖科研机构: 攻读博士学位或进入国内外知名研究院(如MSRA、达摩院、商汤等),在AI前沿领域进行深度探索。
●具体职位包括但不限于:
○知识图谱算法专家
○大模型应用研发工程师
○多智能体系统工程师
○数据科学家
○AI平台研发工程师
掌握“知识图谱+LLM”这一核心竞争力的学生,将成为推动各行各业进行智能化升级的中坚力量,是通往未来AI黄金时代的宝贵船票。


