“…早期的方法一般是将实体与实体类型作为三元组的头尾实体, 谓词就是 type, 这样构成的 RDF 三元组可以利用嵌入式学习过程完成向量表示的学习, 从而完成类型预测任务. 但是仅仅简单地将实 体的一个类型作为尾实体而言会损失很多信息, 比如实体所在文本的上下文环境信息, 外部知识库中 对该类实体的描述等, 而且一个实体的类型是多样且有层次的, 所以对某个实体的相关文本也可以做 嵌入式学习 [69,70] , 比如将其本身及上下文环境都变为低维向量的表示形式, 然后将这些低维向量输入 到深度学习模型中 [71,72] , 从而使类型的推理简化为利用神经网络模型来执行的类别判断, 此时在网络 中也还可以引入注意力机制, 该机制可以来自于自然语言处理技术中常用的条件约束, 也可以使用知 识库中已知的类型层次结构信息来产生, 总之就是要引入外部信息 [72] 来改进嵌入式方法的效果. [75] 使用后向传播方法来完成权值优化, 但需要非常多次迭代才能收敛; Minkov 和 Cohen [76] 在 2008 年提出了基于生成学习模型的随机游走策略以使路径上的实体更相关; 特别在 2010 年, Lao 等 [77] 提出了代表性的路径排序算法 PRA (path ranking algorithm), 其优化了边参数化随机游走模型, 并增加了约束以提高计算效率.…”