leaf_size越大,树的构建时间越快
不同的 leaf_size 大小会改变查询成本的优次,当 leaf_size 接近 1 时,遍历节点所涉及的开销大大减慢了查询时间。当 leaf_size 接近训练集的大小,查询本质上变成了暴力搜索(brute force)。在这之间的一个很好的妥协是 leaf_size = 30,这是该参数的默认值。
随着 leaf_size 的增加,存储树结构所需的内存减少,对于存储每个节点的 D 维质心的 ball tree 这点至关重要。针对 ball tree 所需的存储空间近似于 (1 / leaf_size) 乘以训练集的大小。
三个资料Q群下载不了也转发不了,先放这里Fine_tuning.zipLangChain.zipdata_clear.rar