首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏CreateAMind

    系统比较RL与AIF

    主动推理是一种建模生物和人工智能代理行为的概率框架,源于最小化自由能的原则。近年来,该框架已成功应用于多种旨在最大化奖励的情境中,提供了与替代方法相媲美甚至有时更好的性能。在本文中,我们通过展示主动推理代理如何以及何时执行最大化奖励的最优操作,澄清了奖励最大化与主动推理之间的联系。确切地说,我们展示了在何种条件下主动推理产生贝尔曼方程的最优解,该方程是模型驱动的强化学习和控制的几种方法的基础。在部分观察到的马尔可夫决策过程中,标准的主动推理方案可以产生规划时域为1时的贝尔曼最优操作,但不能超越。相反,最近开发的递归主动推理方案(精细推理)可以在任何有限的时间范围内产生贝尔曼最优操作。我们通过讨论主动推理与强化学习之间更广泛的关系,补充了这一分析。

    53510编辑于 2024-01-17
  • 来自专栏CreateAMind

    为工程师设计的自由能agent软件

    这个问题很重要,因为申请奖学金的人数 托诺莫斯·AIF代理公司预计将大大超过AIF和机器人领域的世界级专家。 到目前为止,我们的论点强烈支持AIF作为机器人的信息处理引擎。不幸的是,模拟一个非平凡的合成AIF代理的计算需求是极端的。 [11].首先,AIF代理中的FE泛函可以被解释为原则上适用于所有问题的通用性能标准。如果FEM可以扩展到结构模型调整,那么AIF代理自然能够创建和解决子问题。 因此,我们相信这些工具将作为AIF原型和验证工具很好地服务于社区,但是它们不会扩展到支持具有商业化价值的AIF代理的实时、健壮的模拟。 AIF代理商的用户友好规范将于今年夏天发布。

    78930编辑于 2023-09-27
  • 来自专栏韦东山嵌入式

    Tina_Linux_音频_开发指南

    1:AIF1_DA0R;2:SUM_AIF1DA0L_AIF1DA0R;3:AVE_AIF1DA0L_AIF1DA0R AIF1IN0R Mux AIF1IN0R Mux设置 0:AIF1_DA0R; 1:AIF1_DA0L;2:SUM_AIF1DA0L_AIF1DA0R;3:AVE_AIF1DA0L_AIF1DA0R AIF1IN1L Mux AIF1IN1L Mux设置 0:AIF1_DA1L; 1:AIF1_DA1R;2:SUM_AIF1DA1L_AIF1DA1R;3:AVE_AIF1DA1L_AIF1DA1R AIF1IN1R Mux AIF1IN1R Mux设置 0:AIF1_DA1R; 1:AIF1_DA1L;2:SUM_AIF1DA1L_AIF1DA1R;3:AVE_AIF1DA1L_AIF1DA1R AIF1OUT0L Mux AIF1OUT0L Mux设置 0:AIF1_AD0L ; 1:AIF1_AD0R;2:SUM_AIF1AD0L_AIF1AD0R;3:AVE_AIF1AD0L_AIF1AD0R AIF1OUT0R Mux AIF1OUT0R Mux设置 0:AIF1_AD0R

    8.7K10编辑于 2023-02-25
  • 来自专栏CreateAMind

    集体智慧发生的机制

    理论上,任何一个时空尺度的 AIF 智能体都可以同时由低于其尺度的嵌套 AIF 智能体和高于其尺度的较大 AIF 智能体的组成部分组成[40‑42]。 因此,在AIF 下,集体智慧可以被建模为个体 AIF 主体的案例,这些个体 AIF 主体在集体规模内相互作用(或者实际上相互作用产生)上级 AIF 主体[9,43]。 集体智慧的 AIF 模型从描述最小的 AIF代理开始。 建立了 AIF 智能体的概念后,开发集体智能 AIF 模型的下一步是考虑跨个人和集体组织规模的多个嵌套 AIF 智能体的存在。 范式和 AIF 模型因其计算能力而有吸引力作为具有最小可行复杂性的简单 AIF 代理的可实现性和易处理性。

    46310编辑于 2024-03-06
  • 来自专栏linux驱动个人学习

    ALSA声卡驱动的DAPM(一)-DPAM详解

    SND_SOC_DAPM_AIF_OUT("CS-VOICE_UL1", "CS-VOICE Capture", 0, 0, 0, 0), 25 SND_SOC_DAPM_AIF_IN("VOICE2 0, 0, 0), 27 SND_SOC_DAPM_AIF_IN("VoLTE_DL", "VoLTE Playback", 0, 0, 0, 0), 28 SND_SOC_DAPM_AIF_OUT SND_SOC_DAPM_AIF_IN("HDMI_DL_HL", "HDMI_HOSTLESS Playback", 0, 0, 0, 0), 57 SND_SOC_DAPM_AIF_IN( SND_SOC_DAPM_AIF_OUT("STUB_RX", "Stub Playback", 0, 0, 0, 0), 175 SND_SOC_DAPM_AIF_IN("STUB_TX", 0, 0), 177 SND_SOC_DAPM_AIF_IN("SLIMBUS_1_TX", "Slimbus1 Capture", 0, 0, 0, 0), 178 SND_SOC_DAPM_AIF_IN

    10.4K61发布于 2018-03-29
  • 来自专栏CreateAMind

    动作过程中进行反馈校正的控制策略

    AIF的核心是一个强大的生成模型的存在,该模型基于相同的自由能最小化原则驱动感知、控制、学习和规划[7]。然而,学习这些生成模型仍然具有挑战性。 利用世界生成模型的思想是AIF的核心组成部分,这是一个通过联合最小化主体的期望自由能(EFE)来统一感知、规划和行动的框架[1,7,13]。 此外,AIF包括优于优选状态的全局优先的概念,这比RL代理的奖励寻求更灵活,因为它可以通过奖励以及其他方法如专家模仿来获得。 最近的概念验证AIF实现表明,这种框架能够通过预测处理进行自适应控制,例如在机械臂中[19]。 实际上,机器学习团体的大多数AIF实现使用神经网络来学习与EFE的最小化相关的概率量的近似值,称为深度主动推理。

    44330编辑于 2023-10-10
  • 来自专栏CreateAMind

    间歇主动推理 Intermittent Active Inference

    主动推理(AIF)智能体模拟多种内部认知过程,以确定一系列未来动作的规划。 图 1 并列展示了经典 AIF 与间歇 AIF 的鼠标光标轨迹。IAIF 智能体仅在当前规划变得比预期更差或结束时才启动规划阶段。这释放了计算资源,尤其对于较大目标而言。 材料与方法 在 3.1 节中,我们将首先介绍方法学背景,即连续的、基于采样的主动推理(AIF)。本节不提供新颖的方法论,其主要目的是介绍 AIF 智能体与环境之间的一般交互循环及符号表示。 AIF 智能体的根本要求在于必须预测和预判智能体所处环境的各种动态。这一过程最终服务于智能体的自创生目标,即实现其偏好的满足。AIF 智能体嵌入于环境之中,这在数学上通过状态空间及其相关动态来表述。 间歇性对智能体行为影响的分析 单次试验中经典 AIF 与间歇 AIF 的定性行为可能有所不同。图 7 展示了经典 AIF 和 IAIF 向目标 6 移动的光标轨迹。

    18210编辑于 2026-04-03
  • 来自专栏磐创AI技术团队的专栏

    热点 | 近期Github机器学习开源项目...

    utm_source=mybridge&utm_medium=blog&utm_campaign=read_more ▌No.4 AIF360:用于检测并去除机器学习模型偏差的开源库 这个 AI Fairness 由于 AIF360 具备一整套功能,所以在面对一个用例时,很可能难以抉择该使用什么指标或算法,为了解决这个问题,开发者为我们提供了可用于参考的使用指南。 ? 项目链接: https://github.com/IBM/AIF360? utm_source=mybridge&utm_medium=blog&utm_campaign=read_more 使用指南: http://aif360.mybluemix.net/resources

    91120发布于 2018-10-22
  • 来自专栏CDA数据分析师

    9月机器学习开源项目Top10

    utm_source=mybridge&utm_medium=blog&utm_campaign=read_more ▌No.8 AIF360:用于检测并去除机器学习模型偏差的开源库 这个 AI Fairness 由于 AIF360 具备一整套功能,所以在面对一个用例时,很可能难以抉择该使用什么指标或算法,为了解决这个问题,开发者为我们提供了可用于参考的使用指南。 ? 项目链接: https://github.com/IBM/AIF360? utm_source=mybridge&utm_medium=blog&utm_campaign=read_more 使用指南: http://aif360.mybluemix.net/resources

    64340发布于 2018-10-25
  • 来自专栏大猪的笔记

    cgo笔记: 内存分配与对象转换

    import "unsafe" func main() { for { var aiList []*C.struct_FileInfo aif := (*C.struct_FileInfo)(C.malloc(C.sizeof_struct_FileInfo)) aif.Name = C.CString("abcd& quot;) aif.Path = C.CString("/path") aiList = append(aiList, aif)

    1.3K20编辑于 2023-03-14
  • 来自专栏唐国梁Tommy

    用户意图对齐,无需人工标注,Zephyr-7B 超越 Llama2-Chat-70B

    supervised fine-tuning, dSFT)和蒸馏直接偏好优化(distilled direct preference optimization, dDPO)以及利用AI反馈(AI Feedback, AIF AIF (AI Feedback) 步骤: ① 响应生成和AI排序: - 从数据集中抽样得到一个提示,例如,“描述如何制作巧克力布朗尼”。 - 有4个不同的语言模型生成对此提示的响应。 首先通过dSFT进行基础的模型训练,然后通过AIF收集反馈并对模型进行评分和排序,最后通过dDPO根据这些反馈优化模型的偏好。 2.2.3 AIF 具体步骤 这种方法基本上是为了通过模型的响应获取更好的教师模型反馈。通过对比多个模型的响应,并利用教师模型为这些响应评分,系统可以更好地理解哪些响应更受偏好。 2.3.6 训练过程 这部分描述了如何使用上述目标函数进行模型训练: 对于每一个 AIF三元组 (x, yw, yl),计算过程如下: ① 在 dSFT 模型中计算 (x, yw) 和 (x, yl)

    1.1K20编辑于 2023-11-02
  • 来自专栏CreateAMind

    主动推理的混合学习-优化范式

    在本文中,我们提出实用好奇心:一种源自主动推断(AIF)(Friston,2010;Friston 等人,2017)的混合学习 - 优化范式。 AIF 通过最小化期望自由能(EFE)规定动作选择,这是一个单一目标,结合了 (i) 偏好首选结果的实用项和 (ii) 偏好信息增益的认知项。 在本节中,我们表明这两个看似竞争的指令可以通过主动推断(AIF)的原则自然地平衡。 3.1. 如图 2 所示,我们的 AIF 算法有效地平衡了参数空间和度量空间的覆盖。这种能力对于搜索更为困难的较小目标集尤其具有显著影响。 图 3 展示了我们的 AIF 方法在学习未知偏好函数方面的卓越能力,这是相对于常因查询方向不当而失败的基线方法的一个关键优势。

    18910编辑于 2026-04-03
  • 来自专栏CreateAMind

    稳定机器人控制的层次主动推理框架

    control https://www.sciencedirect.com/science/article/abs/pii/S095741742504518X 摘要 本文提出“主动推理–视觉运动策略学习”(AIF-VPL 在拖拽(Drag)、转移(Transfer)与推–T(Push-T)三项操作任务上评估表明,AIF-VPL达成93–100%成功率,优于扩散策略与行为克隆基线。 尽管该架构已启发若干计算模型(Buckley 等,2017),现有机器人实现或过度简化层级结构,或未能在真实任务中部署——尤其缺失一个类小脑的主动推理(AIF)层,以通过持续误差校正稳定运动(Oliver 其核心创新在于将多模态感知与层级化控制紧密整合——各层级专精于特定功能…… 结论本文提出了 AIF-VPL——一种用于机器人模仿学习的层级化主动推理框架,成功将神经科学原理与可部署控制架构相联结。

    20210编辑于 2026-03-11
  • 来自专栏Android干货

    项目实战工具类(一):PhoneUtil(手机信息相关)

    Object>(); 258 PackageManager pm = context.getPackageManager(); 259 ApplicationInfo aif = info.applicationInfo; 260 appInfos.put("icon", pm.getApplicationIcon(aif)); 261 appInfos.put ("lable", pm.getApplicationLabel(aif)); 262 appInfos.put("packageName", aif.packageName); 263

    1K50发布于 2018-06-08
  • AI伦理与公平性:算法偏见的识别与缓解措施

    例如,使用AIF360库评估模型的平等机会(equal opportunity): from aif360.metrics import BinaryLabelDatasetMetric from aif360.algorithms.preprocessing import Reweighing # 假设已准备好数值化后的二分类标签数据dataset metric = BinaryLabelDatasetMetric

    8.4K11编辑于 2024-04-18
  • 来自专栏生信技能树

    展示你的特征基因:带"辣椒粉"的markers基因umap图

    metadata = phe) Idents(sce.all.int) <- "celltype" 确定展示的特征基因 我这里挑了12个基因,为每种细胞的已知marker基因,如下: macrophages: AIF1 接下来将多个基因绘制在一个图中,这里总共有12个基因,可以选择4X3的排列方式,比较美观,拼图使用patchwork包: # 确定特征基因 selected_genes <- list("macrophages"="<em>AIF</em>1

    83600编辑于 2025-03-11
  • 来自专栏CreateAMind

    —个主动设计agent

    具体来说,我们基于主动推理(AIF)框架来设计AIDA。源于计算神经科学领域,AIF提出将大脑视为模拟感官输入的预测引擎。从形式上讲,AIF通过指定输入数据的概率生成模型来实现这一点。 为了选择调谐参数试验,给定参数设置的特定选择,AIF代理预测在不久的将来的预期自由能。AIF提供了—个单一的,统一的方法来设计AIDA的所有组件。 由AIF设计代理控制的HA系统的设计涉及解决以下任务: 1.声学环境的分类 2.为HA调整参数选择声学上下文相关试验。 3.HA信号处理算法的执行(由试验参数控制)。 至关重要的是,在AIF框架中,所有这三项任务都可以通过在观测的生成概率模型中变分自由能最小化来完成。由于我们可以通过概率编程语言使变分自由能最小化自动化,人类设计者剩下的唯一任务就是指定生成模型。

    40631编辑于 2023-10-24
  • 来自专栏Mac软件

    Wondershare Recoverit for Mac(万兴数据恢复软件)

    视频AVI,MOV,MP4,M4V,3GP,3G2,WMV,ASF,FLV,SWF,MPG,RM / RMVB等音频AIF / AIFF,M4A,MP3,WAV,WMA,MID / MIDI,OGG,AAC

    1.1K50编辑于 2022-07-26
  • 来自专栏linux驱动个人学习

    高通Audio中ASOC的codec驱动(二)

    snd_soc_dai_driver msm8x16_wcd_i2s_dai[] = { 2 { 3 .name = "msm8x16_wcd_i2s_rx1", 4 .id = AIF1 _PB, 5 .playback = { 6 .stream_name = "AIF1 Playback", 7 .rates = &msm8x16_wcd_dai_ops, 15 }, 16 { 17 .name = "msm8x16_wcd_i2s_tx1", 18 .id = AIF1 _CAP, 19 .capture = { 20 .stream_name = "AIF1 Capture", 21 .rates = MSM8X16

    4K60发布于 2018-03-29
  • 来自专栏机器之心

    大模型自我奖励:Meta让Llama2自己给自己微调,性能超越了GPT-4

    机器之心报道 编辑:泽南、蛋酱 人工智能的反馈(AIF)要代替 RLHF 了? 大模型领域中,微调是改进模型性能的重要一步。 使用这些技能是为了使模型能够执行自对准,即它们是用于使用人工智能反馈(AIF)迭代训练自身的组件。 这个自行创建的 AIF 偏好数据被用作训练集。 所以在微调过程中,相同的模型被用于两个角色:作为「学习者」和作为「法官」。基于新出现的法官角色,模型可以通过上下文微调来进一步提升性能。

    53110编辑于 2024-01-23
领券