我们之前提到了文本摘要的领域,以及该领域的大多数工作如何采用了有限的目标,即根据考虑句子位置的句子的特征来提取和组合被认为是中心的原始文本片段。内容。大部分工作可用于建议可能对文本分类特别有用的区域。考虑一种特征选择形式,您只需根据某些单词对文档进行分类区域。根据文本摘要研究,他们考虑使用(i)仅标题,(ii)仅第一段,(iii)仅标题词或关键词最多的段落,(iv)前两段或第一段和最后一段段落,或(v)所有具有最少标题词或关键词的句子。一般来说,这些位置特征选择方法与互信息产生了良好的结果,并产生了相当有竞争力的分类器。还从文本摘要研究中获取灵感,用标题中的单词或文档内容的核心单词来增加句子,从而使分类准确率提高近1%。这可能是有效的,因为大多数这样的句子在某种程度上对文件的关注更为重要。
练习。
讨论如何设计可能在很大程度上违背此策略的功能。
三个资料Q群下载不了也转发不了,先放这里Fine_tuning.zipLangChain.zipdata_clear.rar