热线电话:13121318867

登录
2018-11-26 阅读量: 1139
实体识别

实体识别是从不同数据源识别出现实世界的实体, 它的任务是统一不同

源数据的矛盾之处, 常见的矛盾有如下几个。

(1) 同名异义

数据源A中的属性ID和数据源B中的属性ID分别描述的是菜品编号和订

单编号, 即描述的是不同的实体。

(2) 异名同义

数据源A中的sales_dt和数据源B中的sales_date都是描述销售日期的, 即

A.sales_dt=B.sales_date。

(3) 单位不统一

描述同一个实体分别用的是国际单位和中国传统的计量单位。

检测和解决这些冲突就是实体识别的任务。

0.0000
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子