cut()根据值本身来选择箱子均匀间隔,即每个箱子的间距都是相同的。
可以看到, cut()自动生成了等距的离散区间,如果自己想定义也是没问题的。
qcut()根据这些值的频率来选择箱子的均匀间隔,即每个箱子中含有的数的数量是相同的。
qcut()切分后每组数据量一样。
除了可以使用 cut()进行离散化之外,qcut()也可以实现离散化。cut()是根据每个值的大小来进行离散化的,qcut()是根据每个值出现的次数来进行离散化的。
三个资料Q群下载不了也转发不了,先放这里Fine_tuning.zipLangChain.zipdata_clear.rar