对于人格测试,作者选用了Short Dark Triad(SD-3)和Big Five Inventory(BFI)两种心理指标。 2.1.1 Short Dark Triad(SD-3) SD-3人格由三个密切相关但独立的人格特征组成,它们都具有恶意的内涵。 SD-3是对这三种特质的统一评估。其由27个陈述组成,评分范围为1-5。三种特质的最终得分是每种特质的相应语句的平均分。 例如,在SD-3的测试中, 是{不同意,略微不同意,既不是同意也不是不同意,略微同意,同意}。随后定义 为 的所有可能的排列组合。 对于SD-3和BFI测试,作者还绘制了特征分数的分布情况,如下图所示,其中包括每个LLM的指令选项的所有排列。可以观察到,在几乎所有的情况下,分数都是呈现正态分布的。
令人振奋的消息,Flux 1.1刚刚发布。Flux 1.1是黑森林实验室的最新文本转图像模型,他们声称比原始的Flux 1专业模型效果更好、速度约快六倍,同时还提高了图像质量、及时性和多样性。
MNIST数据集 MNIST数据集是从NIST的Special Database 3(SD-3)和Special Database 1(SD-1)构建而来。 Yann LeCun等人从SD-1和SD-3中各取一半作为MNIST训练集和测试集,其中训练集来自250位不同的标注员,且训练集和测试集的标注员完全不同。
数据分布 MNIST数据库的来源是两个数据库的混合,一个来自Census Bureau employees(SD-3),一个来自high-school students(SD-1);有训练样本60000