我有这样的数据:
a b
0 0 9
1 1 8
2 2 7
3 3 6
4 4 5
5 5 4
6 6 3
7 7 2
8 8 1
9 9 0
10 10 0
11 11 1
12 12 1我想使用pd.cut()根据其值将a列分离到不同的子类别中。为了做到这一点,有必要获得bins。看起来我们可以通过使用bins手动设置pd.IntervalIndex。
但是我怎样才能让间隔像:[0], (0,2], (2,4], (4,6], (6,8], (8,10], (10,)
我不知道这是否是表示它的正确方法,但它是这样的:一个只有零[0]的整数和一个每个值都大于10 - (100,)的区间。
发布于 2020-09-23 13:00:34
没有一个值的间隔。为了得到同样的结果,我们可以做Inf来关闭和启动。
pd.cut(df.a,[-np.Inf, 0,2,4,6,8,10,np.Inf])
0 (-inf, 0.0]
1 (0.0, 2.0]
2 (0.0, 2.0]
3 (2.0, 4.0]
4 (2.0, 4.0]
5 (4.0, 6.0]
6 (4.0, 6.0]
7 (6.0, 8.0]
8 (6.0, 8.0]
9 (8.0, 10.0]
10 (8.0, 10.0]
11 (10.0, inf]
12 (10.0, inf]
Name: a, dtype: category
Categories (7, interval[float64]): [(-inf, 0.0] < (0.0, 2.0] < (2.0, 4.0] < (4.0, 6.0] < (6.0, 8.0] <
(8.0, 10.0] < (10.0, inf]]https://stackoverflow.com/questions/64028406
复制相似问题