我有一组ABCD单元序列,例如,设A= 0,B= 1,C= 2,D= 4。我可以将序列AAABBBCCCDDD表示为向量000111222444,没有问题。然而,如果我只知道ABCD单元的百分比,但是序列本身是随机的(统计上随机的),那么ABCD的分布可能是任何东西。用Python表示这样的序列最好的方法是什么?
最终的目标是将这样的序列提供给机器学习模型。
谢谢你的帮助!
维托
发布于 2022-02-15 17:25:19
您可以生成具有正确比例字母A、B、C、D的随机序列,如下所示:
import random
length = 10
ratio_a = 0.4
ratio_b = 0.3
ratio_c = 0.2
ratio_d = 0.1
population = (
'A' * round(ratio_a * length) +
'B' * round(ratio_b * length) +
'C' * round(ratio_c * length) +
'D' * round(ratio_d * length)
)
seq = random.sample(population, k=length)https://stackoverflow.com/questions/71130517
复制相似问题