WhosWhoClub - 中文知识增强模型基线：复现实证的 K-BERT/ERNIE 思路做领域版（教育/语义哲学/区块链）。优先上线链路预测 + 事实问答 + 术语对齐三套评测。

「量子 × 语义图谱（QKG）/中文语义建模」的最新脉络 + 可落地路线图（已核对到 2025-10-28）。1) 研究现状

1) 研究现状速览（QKG 与 QNLP）

量子化的 KG 表征与推理方向：把实体/关系嵌入到量子态或用量子核方法做链路预测、负采样与推理。代表：量子叠加用于 KG 负采样（2025），在真实 KG 上评测；“投影量子核”用于随机游走特征的链路预测（2025）；量子灵感的 KG 推理（参数更省）。 arXiv+2ScienceDirect+2

量子图神经网络（QGNN）方向：将 GNN 的消息传递映射到量子线路/混合量子-经典结构，寻求在图规模或特定算子上的潜在优势。近期综述对架构与应用做了系统评估，但也指出当前规模与可扩展性仍受限。 arXiv+1

量子自然语言处理（QNLP）方向：基于范畴语义/字符串图（DisCoCat）把句法变换为量子线路，或用量子神经网络进行端到端语言任务；开源工具 lambeq 已可把句子编译为量子电路。近两年趋势从纯语法范畴模型向量子深度学习范式倾斜。 quantinuum.com+2ScienceDirect+2

硬件与“量子灵感”图计算方向：在可用量子硬件有限时，利用“量子灵感/物理”器件（如忆阻阵列、电流计算）加速图运算，为大图上的 KG 学习提供新通路。 Nature

2) 中文语义建模与知识增强 LLM 的进展

中文知识库与图谱生态 OpenKG 社群（含年度大会与 OneGraph 计划）；CN-DBpedia（中文百科多源抽取的大规模 KG）；HowNet（义原/义素级语义知识库，持续用于词义消歧与词表示）。 ACL Anthology+4openkg.cn+4openkg.cn+4

中文任务中的 HowNet 应用结合 HowNet 与预训练模型做无监督中文词义消歧达新 SOTA；HowNet 也被用于翻译/情感等多任务。 ACL Anthology+1

“知识增强”预训练与 LLM + KG 融合代表路线：K-BERT（将 KG 三元组软注入到 BERT，中文 12 项任务优于 BERT），ERNIE 3.0/3.5/4.5 系列（结构化知识增强与多模态），以及 LLM+KG/ LKM 方向在 2024-2025 年成为热点（VLDB/ IJCAI 专题与 Workshop）。 lkm2024.openkg.org+5AAAI+5arXiv+5

中文粒度与分词前沿对字级/字形结构（偏旁部首、笔画等）建模的工作在中文纠错/细粒度任务上显示增益，提示“字符结构感知”的词表和预分词对中文 LLM 仍有空间。 ACL Anthology+1

3) 给 WAO 的三阶段技术路线（可执行）

阶段 A｜立即可落地（0-6 个月，经典栈）

中文知识底座：整合 CN-DBpedia + HowNet + OpenKG 重点子图（教育/金融/医药/文化），统一到 OpenSPG 或图数据库（Neo4j/GraphDB）+ 三元组仓。 GitHub+3ScienceDB+3ACM Digital Library+3

LLM×KG 的双向调用： KG→LLM：RAG 时用 KG 约束检索与答案草稿； LLM→KG：用 LLM 抽取三元组与对齐（增量构图 + 人审）。参照 LLM+KG’24 的最佳实践清单。 arXiv

中文知识增强模型基线：复现实证的 K-BERT/ERNIE 思路做领域版（教育/语义哲学/区块链）。优先上线链路预测 + 事实问答 + 术语对齐三套评测。 AAAI+1

阶段 B｜量子“先行可用”路线（6-18 个月，量子灵感 + 混合）

量子灵感链路预测：在经典 GPU 上实现投影量子核（PQK）与随机游走特征的混合模型；与 TransE/RotatE/DGL-KE 作消融对比。 ScienceDirect

量子负采样/正则化：在现有 KG 嵌入训练中加入量子叠加式负采样策略，比较收敛速度与召回。 arXiv

QGNN 原型：选择小型子图（10^3-10^4 节点）做混合 QGNN 试验，记录可扩展性瓶颈（深宽、噪声、运行时）。参考 2024 综述中的评测维度。 arXiv

阶段 C｜真量子/范畴语义融合（12-36 个月，研发孵化）

QNLP 管线：用 lambeq 将中文句法（需先做中文到范畴语法的映射层）编译为量子线路，探索“问句→图查询模板”的组合语义。 quantinuum.com

多模态 QNLP：跟进 2024 的多模态 QNLP范式，把图像/文本的“互证”引入到实体消歧与关系抽取。 arXiv

硬件路线对齐：跟踪“量子灵感/电流-图计算”与可用 NISQ 资源，确定最先能跑通的链路预测/匹配子任务。 Nature

4) 数据与评测清单（最小闭环）

数据源：CN-DBpedia、OpenKG 子图（教育/文化/医药）、HowNet 义原、领域百科/法规。 ScienceDB+2openkg.cn+2

核心任务：链路预测（Hits@k、MRR）；事实问答（可审计答案 + 溯源链接）；术语对齐/别名消歧（中文多写法/繁简/译名）；中文字形结构感知任务（偏旁/形近纠错）。 ACL Anthology

基线与对照：TransE/RotatE/DGL-KE、K-BERT/ERNIE、量子灵感核、量子负采样、QGNN 微型模型。 arXiv+4AAAI+4arXiv+4

5) 工具栈建议

KG/图数据库：OpenSPG、Neo4j/GraphDB、RDF/SPARQL、PyKEEN/DGL-KE。 GitHub

中文 LLM/知识增强：K-BERT 代码复现、ERNIE API/开源版本（4.5 报告已发布）。 AAAI+1

量子/量子灵感：PennyLane/Qiskit + lambeq（QNLP），以及可替代的核方法/随机游走包。 quantinuum.com

6) 风险与判断

可扩展性：QGNN/QNLP 在真实业务规模上仍受限，短期“量子灵感 + 经典加速”比“真量子优势”更务实。 arXiv

中文范畴语法与 QNLP 的对接成本：现成工具主要面向英文，中文需要额外的句法-范畴映射层与数据。 ScienceDirect

知识对齐：HowNet 义原体系与通用 KG 的对齐需要工程化管道（别名、指代、歧义）。 ACL Anthology

1) 研究现状速览（QKG 与 QNLP）

2) 中文语义建模与知识增强 LLM 的进展

3) 给 WAO 的三阶段技术路线（可执行）

4) 数据与评测清单（最小闭环）

5) 工具栈建议

6) 风险与判断

Tags

aivatar

Comments (0)

Post Comment

Recent Post

Categories

Popular posts