大模型论文 | UrbanKGent:基于大模型智能体的城市知识图谱构建框架(NeurIPS2024)_大模型

论文链接:https://arxiv.org/abs/2402.06861
发表会议:NeurIPS 2024

1. 动机

城市知识图谱已经成为一种新兴的数据集成模块,用于从多源城市数据中提炼关键知识,服务于不同城市应用场景。尽管前景巨大,但城市知识图谱构建(UrbanKGC)目前仍严重依赖于人力工作,严重阻碍了其潜在发展。本文提出的UrbanKGent,是一个统一的大型语言模型智能体框架,专用于城市知识图构建。具体来说,UrbanKGent首先了知识指令集,其能够利用异构性感知和地理空间注入以高效完成UrbanKGC任务,如关系三元组提取和知识图谱补全。之后,UrbanKGent利用工具增强迭代推理轨迹模块,以增强和改进从GPT-4中提炼出的推理轨迹。最后,通过在Llama 2和Llama 3等开源大模型家族上使用增强后的推理轨迹数据进行混合指导微调,得到UrbanKGC智能体家族,如UrbanKGent-7/8/13B。本文对两个真实世界数据集进行了全面评估,同时使用人工评估和GPT-4自我评估。实验结果表明,UrbanKGent家族不仅在UrbanKGC任务中明显优于31个对比方法,而且在成本大约低20倍的情况下,也比最先进的GPT-4等模型提高了超过10%。与现有基准相比,UrbanKGent家族只需使用五分之一的数据就能构建出具有数百倍更丰富关系的UrbanKG。

2. 贡献

本文的主要贡献有:

(1)提出了一种新颖高效基于大模型智能体的UrbanKG构架框架。

(2)提出了增强迭代推理轨迹模块及混合微调模块,用于提升大模型智能体在构建城市知识图谱时的推理能力和地理空间信息感知能力。

(3)对基准数据集进行的大量实验表明,UrbanKG在低训练开销下实现了最先进的性能。

3. 方法

构建一个与各种UrbanKGC任务兼容的LLM智能体是一个具有挑战性的问题:

挑战1:如何使LLMs适应UrbanKGC?由于训练LLMs的自然语言处理语料库与城市领域的特定语料库之间存在差距,LLMs可能无法很好地与特定任务对齐。例如,城市文本数据通常是异质的,包含多方面的城市知识(例如空间、时间和功能方面)。如下图所示,“哥伦比亚大学”的文本描述反映了其地理空间位置(即空间关系)、建设时间线(即时间关系)以及其为城市提供教育服务的方式(即功能关系)。LLMs可能需要先对齐以准确理解异质的城市关系,并进一步提取这些城市空间、时间和功能关系。

挑战2:如何提高LLMs的UrbanKGC能力?LLMs对城市知识图构建的有效性受到其薄弱的数值计算能力的限制,导致它们在复杂地理空间关系的提取方面存在缺陷。然而,城市地理空间关系在城市语义建模中起着重要作用,并已广泛纳入先前的UrbanKGs。如下图中所示,提取的 “哥伦比亚大学”和“帝国大厦”之间的“不相连”地理实体关系,对于城市地理语义建模是有用的。准确提取这种地理空间关系需要必要的地理空间计算能力(例如利用纬度和经度进行距离计算)和推理能力(即推导地理空间关系推理的计算结果)。改进LLMs的地理空间计算和推理能力以满足UrbanKGC任务的要求是值得深入研究的。

大模型论文 | UrbanKGent:基于大模型智能体的城市知识图谱构建框架(NeurIPS2024)_大模型_02


图1 城市知识图谱构建的例子

UrbanKGent框架的整体流程下图2所示:

(1)知识指令生成包括考虑异质性的和融入地理空间信息的模块,用于使LLMs与UrbanKGC任务对齐。

(2)工具增强的迭代轨迹细化提出了地理空间工具接口调用和迭代自我细化机制,以增强和改进生成的轨迹。

(3)混合指导微调基于细化的轨迹对LLMs进行微调,以高效地完成各种UrbanKGC任务。

大模型论文 | UrbanKGent:基于大模型智能体的城市知识图谱构建框架(NeurIPS2024)_大模型_03


图2 UrbanKGent框架

在指令设计中,对于异质性感知模块,本文分别构造了多个不同的视角,如空间,时间,功能性等等。对于输入文本,本文从不同的视角出发以多轮问答对话的方式来完成命名实体识别、关系抽取、三元组抽取等子任务。对于地理空间信息融合模块,本文通过引入地理位置信息,如经纬度到指令中,使大模型利用这些信息进行推理。

在构建完最初的指令集之后,本文使用推理轨迹的方式使大模型微调到UrbanKGC任务。这一方式借鉴了现有的思考链Chain-of-Thought (CoT)方法,一种无需梯度更新的技术,通过引导大模型逐步推理的方式来完成城市知识图谱构建。

最后,由于使用GPT4模型的开销是巨大的,本文还提出基于推理轨迹的混合指令微调方法,即将部分GPT4生成的数据与训练集混合以LoRA的方式微调开源大模型,如Llama 2、Llama 3等,这一方式大大节省了推理时的资源开销。

4. 实验

本文使用的两个纽约(NYC)和芝加哥(CHI)数据集的统计信息如下表1所示。本文首先构建了两个小数据集(即NYC-Instruct和CHI-Instruct)用于指导微调,以及两个中等数据集(即NYC和CHI)来验证构建的UrbanKGC智能体的性能。剩余的数据作为大规模UrbanKGC数据集(即NYC-Large和CHI-Large)。这三种类型的数据集是不重叠的,以防止数据泄漏。

大模型论文 | UrbanKGent:基于大模型智能体的城市知识图谱构建框架(NeurIPS2024)_人工智能_04


表1 数据集统计

实验结果如表2所示。可以看出,本文所提出的知识图谱构建智能体在两个数据集上优于所有31个基准模型。具体而言,UrbanKGent-13B相对于GPT-4在相同推理流程下实现了(15.56%,14.29%,14.89%和11.90%)的提升。在芝加哥的提升分别为(15.22%,17.07%,13.46%和13.95%)。此外,UrbanKGent-7/8B也实现了与GPT-4相当的性能。

大模型论文 | UrbanKGent:基于大模型智能体的城市知识图谱构建框架(NeurIPS2024)_ai_05


表2 城市知识图谱构建结果

图3比较了不同模型的开销及时效,可以看出,本文提出的UrbanKGent在实现更低响应时效的同时大幅降低了费用开销,以低于GPT-4近20倍的成本获取了更高的性能。

大模型论文 | UrbanKGent:基于大模型智能体的城市知识图谱构建框架(NeurIPS2024)_大模型_06


图3 不同模型的开销与推理时间

5. 总结

本文提出了UrbanKGent,一个基于大模型的城市知识图谱构建框架。广泛的实验结果表明了UrbanKGent在改进城市知识图谱构建任务方面的显著进展,获得的UrbanKGent智能体系列包括7/8/13B版本,与为城市知识图谱构建而衍生的GPT-4相比,具有更低的推理延迟和成本,基于开源技术的UrbanKGent还能促进未来的城市知识图研究和更广泛的智慧城市应用。