2018-11-16
阅读量:
1572
sklearn最近邻算法leaf_size的影响
- 构造时间
leaf_size越大,树的构建时间越快
- 查询时间
不同的 leaf_size 大小会改变查询成本的优次,当 leaf_size 接近 1 时,遍历节点所涉及的开销大大减慢了查询时间。当 leaf_size 接近训练集的大小,查询本质上变成了暴力搜索(brute force)。在这之间的一个很好的妥协是 leaf_size = 30,这是该参数的默认值。
- 内存
随着 leaf_size 的增加,存储树结构所需的内存减少,对于存储每个节点的 D 维质心的 ball tree 这点至关重要。针对 ball tree 所需的存储空间近似于 (1 / leaf_size) 乘以训练集的大小。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论