实体识别是从不同数据源识别出现实世界的实体, 它的任务是统一不同
源数据的矛盾之处, 常见的矛盾有如下几个。
(1) 同名异义
数据源A中的属性ID和数据源B中的属性ID分别描述的是菜品编号和订
单编号, 即描述的是不同的实体。
(2) 异名同义
数据源A中的sales_dt和数据源B中的sales_date都是描述销售日期的, 即
A.sales_dt=B.sales_date。
(3) 单位不统一
描述同一个实体分别用的是国际单位和中国传统的计量单位。
检测和解决这些冲突就是实体识别的任务。
三个资料Q群下载不了也转发不了,先放这里Fine_tuning.zipLangChain.zipdata_clear.rar