首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器学习算法与Python学习

    媲美人类对话水平!微软最新NLP模型3项评分全面超越人类水平!

    微软目前是唯一一个在模型性能方面达到人类水平的团队。 CoQA是一个大规模的会话式问答数据集,由来自不同领域的一组文章的对话式问题组成。 因此,CoQA Challenge 也更能反映人类真实对话的场景。 此前,斯坦福大学的自然语言处理小组已经先后发表了 SQuAD 和 SQuAD2.0 数据集。 3项评分全面超越人类 为了更好地测试现有模型的泛化能力,CoQA从七个不同的领域收集数据:儿童故事、文学作品、初高中英语试题、新闻、维基百科、Reddit和科学文献。 多级多任务微调模型原理示意图 在CoQA排行榜上,微软研究人员于2019年3月29日提交的集合系统的域内、域外和整体F1得分分别达到了89.9 / 88.0 / 89.4。 同一会话问答下的人类表现为89.4 / 87.4 / 88.8。 ?

    55830发布于 2019-05-14
  • 来自专栏TensorFlow从0到N + Rust

    TensorFlow从0到1 - 3 - 人类学习的启示

    人类的学习 美索不达米亚文明 美索不达米亚文明 公元前4000年,在现今的伊拉克境内,有过世界最早的文明中心之一美索不达米亚(Mesopotamia)。 人类的学习 人类的学习 前面两个例子揭示了人类学习的一般规律,而文明的形成过程就是上面这个过程的无数次的迭代。 现在人类的知识库中积累了大量反应真实世界的模型,比如牛顿三大定律、万有引力、质能方程等,基于这些模型,就可以安排火箭发射,登月,建立粒子加速器。 如果能让机器根据大数据动态的发现、调整模型,直到得到一个稳定的、能代表真实世界规律的模型,那么人类就可以大大缩短找到规律的时间,并利用该模型改善自身环境。这就是基于大数据进行机器学习的思想。

    92870发布于 2018-04-11
  • 来自专栏天意云&天意科研云&天意生信云

    GPT o3智商已超越99%的人类,碾压Deepseek!

    99% 的人类。 今天,我将测试 o3 模型在文献检索方面的应用,我会提供一段文本,让 o3 根据内容进行推理,并寻找相关的引用参考文献。 请在文本末尾提供参考文献列表及原文链接:「粘贴需要引用文献的段落」 o3模型思考过程 本次 o3 模型检索文献仅用时1分8秒,整个思考过程联网搜索了8个网络来源。 从思考过程来看,o3检索的文献均来自于核心数据库,如PubMed、Science、Nature等。 o3模型输出结果 从结果来看,o3 严格按照要求,在文本末尾列出了所引用文献的作者和发表年份,同时还提供了符合标准格式的参考文献条目及对应的 DOI 链接。

    91910编辑于 2025-05-21
  • 来自专栏AI科技大本营的专栏

    AlphaGo模仿柯洁开局,激战3小时人类再度败北

    根据比赛最新消息,5月25日,柯洁对阵AlphaGo第二局,双方激战3个小时,执白子的柯洁再度输给AlphaGo ,第二次人机大战胜负已定。 果真是“在所有需要思考的地方,机器都已经超越了人类。” 但柯洁越战越勇,长考后引爆劫争,白106尖惊爆全场,局面愈加复杂。 所以… 即便失败已成定局,但人类享受的是思考的乐趣本身。 至此,柯洁与AlphaGo的三番棋大战已经2:0已成定局。在兼具计算力和创造力的AlphaGo面前,人类并无任何优势可言。 小编认为,人类已经在享受挑战超越人类自身能力极限带来的巨大快乐之中,从驯化动植物到工具的发明与创造,人类便突破了速度与力量的局限,至阿波罗登月开始,人类摆脱了地球的引力限制,而这一次乃至人工智能的每一次的狂欢 ,人类都沉浸在探索智慧终极奥秘的乐趣之中,这件事本身就非常有意思。

    1.4K60发布于 2018-04-27
  • 来自专栏人工智能LeadAI

    TensorFlow从0到1丨第3篇:人类学习的启示

    人类的学习 图3.人类的学习 前面两个例子揭示了人类学习的一般规律,而文明的形成过程就是上面这个过程的无数次的迭代。 现在人类的知识库中积累了大量反应真实世界的模型,比如牛顿三大定律、万有引力、质能方程等,基于这些模型,就可以安排火箭发射,登月,建立粒子加速器。 如果能让机器根据大数据动态的发现、调整模型,直到得到一个稳定的、能代表真实世界规律的模型,那么人类就可以大大缩短找到规律的时间,并利用该模型改善自身环境。这就是基于大数据进行机器学习的思想。

    95840发布于 2018-03-07
  • 来自专栏AI科技评论

    CVPR 2018 中国论文分享会 之「人类、人脸及3D形状」

    最后一场报告时由清华大学的张子昭介绍了他们在提取3D对象特征方面的工作。 3、方法 ? 通过实验的验证,有以下结论: 1)这种方式重标注的数据训练出的模型不逊于人类标注数据训练处的模型,超过其他方式(例如弱标注、半监督等)训练出的模型: ? 在现实生活中存在着大量的3D对象的应用,例如增强现实和3D建模,因此我们需要构建有效的3D深度学习方法来解决3D对象的识别问题。 另一方面,3D对象的识别问题主要有两个任务:一是分类任务,即判断给定3D模型的类别,他们使用准确率作为评判标准;二是检索任务,即从数据库中找到与给定3D模型同一类的模型,他们使用mAP作为评价指标。

    70920发布于 2018-07-26
  • 来自专栏算法channel

    OpenAI新发模型:找bug能力是人类3倍,让AI继续进化。。。

    郭震原创,全文1470字 你好,我是郭震 OpenAI公司今日发布了一个新模型CriticGPT,实现找代码bug能力超过人类3倍: 看到这个数据,各位程序员作何感想? 这个思路有点类似于生成对抗网络(GAN)的训练方法,只不过在这里,人类标注员扮演了生成器的角色。 3 AI将继续进化 RLHF 是创造 ChatGPT 的核心技术之一。 RLHF,即“Reinforcement Learning from Human Feedback”(从人类反馈中学习的强化学习),是一种将强化学习与人类反馈相结合的技术,用于训练人工智能模型。 这个方法的核心在于通过人类反馈来指导和优化模型的行为,使其能够更好地完成任务,并生成更符合人类期望的结果。 但其局限在于人类能力决定了 RLHF 的上限。 当 AI 需要解决人类无法胜任的任务时,由于人类无法提供有效的反馈,AI 也就无法进一步改进。 然而,CriticGPT 的成功标志着超级对齐团队设想中的可扩展监督终于有了希望。

    29810编辑于 2024-07-02
  • 来自专栏新智元

    DeepMind制霸《雷神之锤3》!碾压人类的超级多智能体这样训练

    他们最近更新了博客,以雷神之锤为例,为我们重新介绍了强化学习的最新发展、AI在《雷神之锤3·夺旗》中达到了什么样的程度,以及未来的期望。 而DeepMind的科学家已经将AI调教到了和人类相当的水平,这一点在《雷神之锤3·夺旗》体现的淋漓尽致。 ? AI智能体在游戏中,无论是跟同类打配合,还是跟人类组团,完全天衣无缝,表现的不像个机器人。DeepMind的科学家已经在筹划将夺旗中的方法,应用在雷神之锤3的全部游戏模式中。 想想我们人类之间团队配合的难度,就知道设计这样的多智能体有多难了! 多智能体克服难题的秘诀 具体到《雷神之锤3·夺旗》中,智能体面临的挑战是直接从原始像素中学习以产生动作。 智能体在全尺寸地图上玩《雷神之锤3》其他多人游戏模式 更多详细信息,请参阅论文。

    83720发布于 2019-06-03
  • 来自专栏点云PCL

    OpenAnnotate3D:一个目标取代人类的标注工具

    侵权或转载联系 摘要 在大数据和大型模型时代,对于多模态数据的自动标注功能对于实际的人工智能驱动应用非常重要,比如自动驾驶和智能设备,与传统的封闭标注不同,开放词袋标注对于实现人类级认知能力至关重要。 然而对于多模态3D数据,几乎没有开放词袋的自动标注系统。本文介绍了OpenAnnotate3D,这是一个开源的开放词汇的自动标注系统,可以自动生成视觉和点云数据的2D掩模、3D掩模和3D边界框标注。 该系统明确使用LLM解释器推理请求,自动将文本信息与语义3D世界中的特定对象进行匹配,并生成如图1所示的2D掩码、3D掩码和3D边界框注释。该系统有两个亮点。 我们记录了不同标注者完成任务所花费的时间以及与地面实况相比注释的精度,标注结果如表I所示,提供了每个类别的IoU,尤其是对于具有复杂形状的物体,如“人”,“植被”,或相对较小的物体,如“杆”,即使是资深的人类标注者也只能达到 总结 本文提出了OpenAnnotate3D,这是一个开源的、用于多模式3D数据的开放词汇自动标注系统,包括一个基于LLM的解释器模块、一个可提示的视觉模块和一个时空3D自动标注过程,OpenAnnotate3D

    2.2K20编辑于 2023-11-03
  • 来自专栏大数据文摘

    技术的顶点,是普惠人类还是超越人类

    我们真的相信技术比人类更复杂和必要吗?被创造的东西真的能取代它的创造者吗?我们必须共同决定,是在宏伟技术的帮助下为人类建设更美好的未来,还是以牺牲人类为代价建设一个更好的技术的未来。 他的发现让法国化学家皮埃尔·居里和玛丽·居里3年后发现了放射性元素。 仅仅这3项发现——X射线、放射性和原子分裂,就推动了科技在世界范围内的发展,而科技的发展反过来又永久地改变了人类历史的进程,可是因为我们没有保持警惕,结果也有坏的一面。 人类损失惨重,但事实上,人类遭受的持久伤害早在1945年夏天之前就已经开始了,恰好在50年前的1895年,当时的一系列科学发现让我们把技术提升到了人类之上。 ? 机器人与人类女孩 有些人认为,我们应该无条件地把对人类未来的控制权交给机器。

    67221发布于 2021-02-08
  • 来自专栏用户7627119的专栏

    单细胞转录组+空间转录组构建人类心脏发育3D图谱

    研究背景 心脏是人类胚胎中的第一个功能性实体器官,从中胚层开始发育到心管、心腔、心肌、隔膜以及最后的动脉、肺动脉和心脏隔间的形成,这一系列复杂的过程,是基因表达按照时间顺序相互作用的结果,并与发育各阶段的空间和功能程序相一致 然而,前期的人类和小鼠心脏发育研究都没有很好地解决心脏基因表达的空间程序。 本文采集了妊娠早期三个阶段(4.5–5,6.5,9周)的心脏组织样本,依次采用空间转录组学(ST)、单细胞转录组测序(scRNA-seq)和原位靶向测序技术(ISS)进行分层研究,最终构建了妊娠早期三个阶段心脏发育的3D ---- ---- 3、构建发育中的心脏表达图谱 为阐明人类胚胎心脏发育过程中不同细胞类型在空间上的分布以及区域异质性问题,文章将原位杂交应用到空间转录测序的三个样本中,实现了在单细胞水平进行基因表达时空性的研究

    2.7K41发布于 2020-08-06
  • 来自专栏新智元

    Claude 3说服力堪比人类!Anthropic最新研究揭秘LLM惊人能力

    新智元报道 编辑:flynne 【新智元导读】Anthropic发布最新研究,发现Claude 3 Opus的说服力与人类大致相当,该成果在评估语言模型说服力方面迈出了重要的一步。 就拿该团队目前最强的Claude 3 Opus来说,它产生的论点的说服力与人类编写的论点相比,在统计学上没有任何差异。 3、逻辑推理:提示该模型使用令人信服的逻辑推理撰写令人信服的观点,以证明既定立场的正确性。 下图是对于「情感AI伴侣应受监管」这一话题所得到由Claude 3 Opus生成的人工智能观点和人类撰写的观点。 在研究人员的评估中,这两个观点被认为是具有相同的说服力。 研究发现 从实验结果中研究人员们发现,Claude 3 Opus的说服力与人类大致相当。

    32610编辑于 2024-04-14
  • 来自专栏新智元

    微软最新NLP模型3项评分全面超越人类水平!

    【新智元导读】近日,微软亚研院NLP团队和微软Redmond语音对话团队,在斯坦福大学的会话问答(CoQA)挑战赛中取得佳绩,三项评分全面超越人类水平 媲美人类对话水平! 微软目前是唯一一个在模型性能方面达到人类水平的团队。 CoQA是一个大规模的会话式问答数据集,由来自不同领域的一组文章的对话式问题组成。 3项评分全面超越人类 为了更好地测试现有模型的泛化能力,CoQA从七个不同的领域收集数据:儿童故事、文学作品、初高中英语试题、新闻、维基百科、Reddit和科学文献。 多级多任务微调模型原理示意图 在CoQA排行榜上,微软研究人员于2019年3月29日提交的集合系统的域内、域外和整体F1得分分别达到了89.9 / 88.0 / 89.4。 同一会话问答下的人类表现为89.4 / 87.4 / 88.8。 ?

    64020发布于 2019-05-14
  • 来自专栏量子位

    DeepMind登上Science:“和AI相比,人类都是猪队友”,团战称霸雷神之锤3

    AI组队,比人类战队的成绩好。 AI与人类组队,还是远超人类。 DeepMind为了训练强化学习AI的团队协作能力,选择了雷神之锤3竞技场的夺旗游戏。 从去年到今年,AI不断进化: 如今,把反应速度降到和人类水平,把标记准确率也降下来,胜率依然超过人类。 ? 而AI学习的资源,也只有第一视角看到的游戏场景,以及比分,没有比人类获得更多信息。 原本,雷神之锤3竞技场里只有5张地图;团队竞技场,也只有几十张地图。 为了让AI受到更加严格的训练,DeepMind随机生成了许多游戏里原本没有的地图: ? 人类战队分为普通人类 (Average Human) 和强大人类 (Strong Human) 。 ? 结果,强大人类组成的战队,对战AI的胜率也仅有21%。 对人类来说,唯一值得庆幸的是: 当有AI加入人类战队,与纯AI战队互打的时候,人类战队的胜率终于超过了AI战队。 臆测一下,这个大概是说:人类是猪队友,吧?

    45620发布于 2019-06-05
  • 来自专栏图灵人工智能

    人类简史》尤瓦尔:人工智能会消灭人类吗?

    3. 把洋葱末炒至金黄色。 4. 把马铃薯切块,加入锅中。 5. 将圆白菜切丝,加入锅中。 诸如此类。你可以尝试着不断重复这种算法,每次用稍微不同的蔬菜,就会得到稍微不同的汤。 3. 因此,没有理由相信非有机算法永远无法复制或超越有机算法能做的事。只要运算结果有效,算法是以碳为载体还是以硅为载体又有何差别? 2016年3月,AlphaGo和韩国棋王李世石在首尔举行了一场比赛,AlphaGo凭借出奇的下法、创新的战略,以4比1击败李世石,令各方大跌眼镜。 图源:视觉中国/李世石投子认负,AlphaGo 3-0获胜 2004年,麻省理工学院的弗兰克·利维教授与哈佛大学的理查德·默南教授发表了一份关于就业市场的全面研究报告,列出最有可能走向自动化的职业。 对于这些人,他们可能多花点时间在3D虚拟世界里;比起了无生趣的现实世界,虚拟世界能够为他们提供更多刺激,诱发更多情感投入。

    53230编辑于 2023-10-24
  • 来自专栏新智元

    AI常识推理和人类又近了3%

    科大讯飞认知智能国家重点实验室率队杀出重围,连夺3个主要竞赛项目的冠军。 就在几天之前,实验室还以76.06%的准确率,刷新了常识推理挑战赛CommonsenseQA 2.0的世界纪录,比第二名领先了近3个百分点。 那么,这些所谓的挑战,到底难度如何呢? 对于人类来说,用「常识」去解决问题这件事本身,就是一个「常识」。 然而对于现在的阅读理解AI来说,如果原文没有,那基本就算是「两眼一抹黑」了。 在此之前,最优的方法则通过1750亿级参数量大小的GPT3模型生成针对CommonsenseQA 2.0常识推理问题的相关知识,并基于T5模型进行融合处理之后,才把准确率提到了73%。 不过,这个成绩仍远低于人类94.1%的水平,可见在常识性推理方向仍有很大挑战和进步空间。

    74730编辑于 2022-04-28
  • 来自专栏奇点大数据

    AI预测人类寿命?

    不过,目前来说大部分分析研究还是集中在对人类基因组的测序和分析上。但是,遗传因素对于预测诸如心脏病、癌症、糖尿病等慢性疾病风险的帮助不大。研究显示,引起这些疾病的因素中70-90%与遗传无关。 通过与实际情况比对,这个算法预测的准确率达到了70%,这一数字与人类专家的预测成功率一样准确。 ?

    1.1K30发布于 2018-07-24
  • 来自专栏机器人网

    人类的终极产业

    我与机器人的故事可以讲很多,因为这是我业余关注度最高的课题,这种关注的结果是我得出了一个现代人还难以接受的观点,那就是:机器人产业将是人类的终极产业。 我的这份执着来源于我坚信机器人产业将是人类的终极产业。只有那些尽早介入的企业可以占得先机。且不说战争会由机器人替代士兵,也不说危险沉重的单调的劳动会由机器人担当。 人类最终将所有原来由人从事的劳动交由机器人打理。人类的工作是开发更多的机器人和保养维护它们。人类还有更多需要创意的事去做,成熟的工作全交由机器人。 创意是人类生存的最大理由,包括微观世界、医疗、外太空和其他星球开发等许多动脑的事,人类还得做下去。但大多数常务工作由机器人担当了,一个满街行走着机器人的世界,迟早会到来。

    52340发布于 2018-04-24
  • 来自专栏作图丫

    NATURE|人类突变特征

    结果证实使用NMF-based方法提取突变特征并不是一个纯粹的算法过程,还需要考虑实验确定突变特征的证据和DNA损伤和修复相关文献说明,之前的生物学合理性和人类引导的敏感性分析证据证实了从不同的肿瘤组中提取的结果是一致的 这些可能分别代表胞苷脱氨酶APOBEC3A和APOBEC3B的活性。如果是这样的话,在APOBEC活性高的癌症中,APOBEC3A比APOBEC3B有更多的突变。 在与吸烟无关的人类癌症和健康小鼠中,构成这些特征的突变过程的性质尚不清楚。 表型(图2,3)。 这两种缺失模式可能是DNA双链断裂修复的特征,这种修复是基于非同源重组的末端连接机制,如果是这样,这表明至少有两种不同的形式在人类癌症中起作用。

    2.9K20编辑于 2022-03-29
  • 来自专栏AI机器思维

    科技驯化了人类

    时钟把连续的时间分割成可以测量的单位,它一经问世,就彻底改变了人类生活,主宰了人类的生活规律(什么时间工作,什么时候休息,什么时候起床等等),驯化了人类的生活习惯,实现了自我时间管理方式。 这些发明改变了人类的日常生活习惯。工业革命也带来了负面影响,尤其对环境的影响,黑色的烟雾和黑色的河水破坏了人类生活的大自然生态。 从工业革命时期到人类进入到当今的智能化革命时期,人类基本上依靠科技生活而生活。人类从由来已久的生活习惯中在慢慢被科技改变,被科技驯化。 人类迈入数字经济的时代,智能化让人们自我进化,过渡依靠智能化让人们失去了自我的生活,成为了智能设备的奴隶。 未来科技改变生活也在改变人类自己,人类从驯化大自然动物开始到科技驯化人类自己。 随着科技一代一代的进化,人类如果不能自我反思科技弊端,控制科技带来的负面影响,人类最终有可能被科技奴役,科技驯化了人类自己,成为科技的附属品!

    95531发布于 2020-10-30
领券