首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏拓端tecdat

    R语言广义加性模型GAM、Tweedie分布的SaaS客户生命周期价值CLV预测研究——非线性关系捕捉与异方差性适配创新|附代码数据

    本研究将GAMs引入SaaS行业的CLV预测,结合Tweedie分布解决收入数据的异方差性问题,不仅实现了预测精度的提升,还能提取可解释的业务洞察,如客户升级阈值、功能采纳投资回报率等。 本研究首先梳理SaaS业务的CLV预测痛点,随后通过模拟贴合真实业务的客户数据,构建基于GAMs的CLV预测模型,对比高斯分布与Tweedie分布的适配效果,最终提取可落地的业务决策建议。 3.2 引入Tweedie分布优化模型Tweedie分布是一类包含泊松-伽马复合分布的广义分布,其方差与均值满足Var(Y) = φ·μ^p(φ为离散参数,μ为均值,p为幂参数),能适配收入数据的异方差性 本研究中拟合的Tweedie模型幂参数为1.935,介于1和2之间,完美适配CLV数据特征。 模型对比结果显示,Tweedie模型的AIC值(7248.197)远低于高斯模型(8235.860),拟合效果显著更优。

    20010编辑于 2026-02-24
  • 来自专栏AI科技时讯

    XGBoost中的参数介绍

    它可能对建模保险索赔强度或任何可能服从伽玛分布的结果很有用 reg:tweedie: 带对数链接的 Tweedie 回归。 它可能对建模保险总损失或任何可能服从 Tweedie 分布的结果很有用 base_score 所有实例的初始预测得分,全局偏差 在训练之前,该参数会在选择的目标函数中被自动估算。 :Tweedie 回归的负对数似然(在 tweedie_variance_power 参数的指定值处) aft-nloglik:加速失效时间模型的负对数似然。 (objective=reg:tweedietweedie_variance_power [默认值=1.5] 控制Tweedie分布方差的参数 var(y) ~ E(y)^tweedie_variance_power Regression (objective=reg:tweedie) Parameter for using Pseudo-Huber (reg:pseudohubererror) Parameter

    1.4K10编辑于 2024-03-25
  • 来自专栏拓端tecdat

    R语言中广义线性模型(GLM)中的分布和连接函数分析

    link="identity"),data=base) regIGlog = glm(y~x,family=inverse.gaussian(link="log"),data=base 还可以考虑一些Tweedie 例如,在线性情况下,考虑使用Tweedie模型获得的斜率(实际上将包括此处提到的所有参数famile) ​ 这里的坡度总是非常接近,如果我们添加一个置信区间,则 ​ 对于Gamma回归或高斯逆回归,

    4.6K21发布于 2020-10-21
  • 来自专栏机器之心

    扩散模型背后数学太难了,啃不动?谷歌用统一视角讲明白了

    µ_q(x_t, x_0),则可以重新推导如下: 因此可以将近似去噪转换均值 µ_θ(x_t, t) 设置为如下: 并且相应的优化问题变成如下: 为了推导出变分扩散模型的三种常见解释,需要求助于 Tweedie 从数学上讲,对于一个高斯变量 z ∼ N (z; µ_z, Σ_z),Tweedie 公式表示如下: 基于分数的生成模型 研究者已经表明,变分扩散模型可以简单地通过优化一个神经网络 s_θ(x_t, 但是,推导中的得分项来自 Tweedie 公式的应用。这并不一定为解读得分函数究竟是什么或者它为什么值得建模提供好的直觉或洞见。 好在可以借助另一类生成模型,即基于分数的生成模型,来获得这种直觉。

    1.5K40编辑于 2022-08-29
  • 来自专栏CreateAMind

    GANs, mutual information, and possibly algorithm selection?

    not only myself have thought about it, e.g. in this paper the authors connected beta-divergences to tweedie

    36130发布于 2018-07-25
  • 来自专栏AI科技时讯

    XGB-3:Xgboost模型IO

    "type": "object", "properties": { "name": { "const": "reg:tweedie " }, "tweedie_regression_param": { "type": "object", "properties": { "tweedie_variance_power": { "type": "string" } } }, "required": [ "name", "tweedie_regression_param

    86010编辑于 2024-05-18
  • 来自专栏数据派THU

    【2023新书】机器学习集成方法

    本章涵盖了线性回归、泊松回归、伽马回归和Tweedie回归的并行和顺序集成。 第8章确定了使用非数值特征学习的挑战,特别是分类特征,以及将帮助我们为此类数据训练有效集成的编码方案。

    46240编辑于 2023-04-18
  • 来自专栏三木的博客

    NBD-网络块设备[翻译]

    Krzysztofowicz贡献了64位机上运行的版本,随后Stephen Tweedie 为其提出了许多的专业建议,尤其是引入了基于信号量的锁机制,使得代码在对称多处理器系统中能够安全的运行。

    2.3K90发布于 2018-02-07
  • 来自专栏python3

    EXT3与EXT4

    Stephen Tweedie在1999年2月的内核邮件列表[2]中,最早显示了他使用扩展的ext2,该文件系统从2.4.15版本的内核开始,合并到内核主线中[3]。

    2.9K20发布于 2020-01-06
  • 来自专栏蓝天

    全面了解安装使用Linux下的日志文件系统

    目前Linux环境下的日志文件系统     在下面的内容里将讨论三种日志文件系统:第一种是ext3,由Linux内核Stephen Tweedie开发。 Stephen Tweedie的论文和访谈。ext3日志式文件系统直接来自于其祖先ext2文件系统。其具有完全向后兼容的关键特性,实际上其仅仅是在ext2日志式文件系统上添加了日志功能。

    3.1K20发布于 2018-08-07
  • 来自专栏机器之心

    7 Papers & Radios | Bengio等创建GNN权威基准;130页知识图谱综述论文

    通过数据分析,他们得出了以下两个观察结果,其一是将不同的零售(商)分组后呈现出的销售季度性,其二是将销售状况转化为预测值后呈现出的 Tweedie 分布。 然后他们提出在对数变换后对销售的 Tweedie 损失进行优化。最后,研究者将这两种销售预测机制应用于经典回归模型,即神经网络和梯度提升决策树。 ? 天猫平台上不同零售商的销售呈季度性波动。 ?

    56030发布于 2020-03-11
  • 来自专栏DeepHub IMBA

    已经14年的Scikit-Learn终于1.0了,发布第一个主要版本的意义是什么?

    新指标:pinball_loss 和 tweedie_score。 用于显示结果的新图 CalibrationDisplay。

    99450发布于 2021-10-20
  • 来自专栏about云

    Spark机器学习库(MLlib)指南之简介及基础统计

    data-frame API的相关分析和卡方检验 (SPARK-19636 and SPARK-19635) 频繁模式挖掘中的FPGrowth算法 (SPARK-14503) 广义线性模型(GLM)支持Tweedie

    2.2K70发布于 2018-03-26
  • 来自专栏机器之心

    解锁任意步数文生图,港大&Adobe全新Self-E框架学会自我评估

    Self-E 的关键观察是:模型在「从数据学习」阶段会逐步学到某种条件期望形式,而该量与 score 通过 Tweedie’s formula 存在联系,因此可以用「正在训练的模型」去近似提供评估方向。

    14710编辑于 2026-01-22
  • 来自专栏ShowMeAI研究中心

    机器学习实战 | LightGBM建模应用详解

    tweedie:表示tweedie回归任务。 binary:表示二分类任务,使用对数损失函数作为目标函数。 multiclass:表示多分类任务,使用softmax函数作为目标函数。 tweedie:表示Tweedie回归的负对数似然。 ndcg:表示NDCG。 map或者mean\_average\_precision:表示平均的精度。 auc:表示AUC。

    4K22编辑于 2022-03-21
  • 来自专栏算法进阶

    数据挖掘神器LightGBM详解

    tweedie:表示tweedie回归任务。 binary:表示二分类任务,使用对数损失函数作为目标函数。 multiclass:表示多分类任务,使用softmax函数作为目标函数。 tweedie:表示Tweedie回归的负对数似然。 ndcg:表示NDCG。 map或者mean_average_precision:表示平均的精度。 auc:表示AUC。

    2.3K10编辑于 2023-12-26
  • 来自专栏AIGC 先锋科技

    GPU4090 助力方案 | 用潜在图像扩散模型解决高分辨率视频逆问题 !

    在 t 步骤 时,作者通过并行使用 Tweedie 公式 [7] 和潜变量扩散模型 对给定的潜变量 进行采样,从而得到去噪批次 。 考虑在时间方向上并行采样潜在扩散模型: 去噪后的潜在变量 使用Tweedie公式[7]计算得出: 其中 是在扩散模型的高斯过程 [9, 16] 中定义的噪声调度。

    68610编辑于 2025-01-17
  • 来自专栏机器之心

    平息画师怒火:Stable Diffusion学会在绘画中直接「擦除」侵权概念

    基于 Tweedie 公式以及重新参数化技巧,对数概率 score 的梯度可以表示为通过时变参数缩放的 score 函数。修改后的 score 函数移动数据分布以使对数概率 score 最大化。

    1.1K60编辑于 2023-04-11
  • 来自专栏Datawhale专栏

    我的XGBoost学习经历及动手实践

    reg:tweedie:使用对数链接进行Tweedie回归。

    2K21发布于 2020-06-23
  • 来自专栏JetpropelledSnake

    机器学习笔记之机器学习算法XGBoost

    7.3 Tweedie Regression 参数 weedie_variance_power[默认为5] 指定了tweedie 分布的方差。 ‘reg:tweedie’:’tweedie regression’。 base_score[默认为5] 所有样本的初始预测分,它用于设定一个初始的、全局的bias。 repeatedly poisson-nloglik 对于泊松回归,使用负的对数似然 gamma-nloglik 对于伽马回归,使用负的对数似然 gamma-deviance 对于伽马回归,使用残差的方差 tweedie-nloglik : 对于tweedie 回归,使用负的对数似然 Seed[默认0] 随机数的种子,设置它可以复现随机数据的结果,也可以用于调整参数。

    3K10发布于 2021-03-04
领券