阿抽哥哥

2018-11-16   阅读量: 1239

数据分析师 机器学习

sklearn最近邻算法leaf_size的影响

扫码加入数据分析学习群
  • 构造时间

leaf_size越大,树的构建时间越快

  • 查询时间

不同的 leaf_size 大小会改变查询成本的优次,当 leaf_size 接近 1 时,遍历节点所涉及的开销大大减慢了查询时间。当 leaf_size 接近训练集的大小,查询本质上变成了暴力搜索(brute force)。在这之间的一个很好的妥协是 leaf_size = 30,这是该参数的默认值。

  • 内存

随着 leaf_size 的增加,存储树结构所需的内存减少,对于存储每个节点的 D 维质心的 ball tree 这点至关重要。针对 ball tree 所需的存储空间近似于 (1 / leaf_size) 乘以训练集的大小。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 4 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子