首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏新智元

    人类危险】谷歌Waymo宣布放弃人类辅助驾驶功能,全面押注L4

    Krafcik 说,在观看测试中的无人车内的监控视频后,公司确定这样一种在遇到危险情况时拉响警报让人类驾驶员接手操作的系统并不安全。 这些测试视频是在2013年进行的,当时谷歌的员工坐在驾驶员座位上。

    59860发布于 2018-03-21
  • 来自专栏新智元

    GPT-4被证实具有「人类心智」登Nature!AI比人类更好察觉讽刺和暗示

    Nature最新研究显示,GPT-4的行为可与人类媲美,甚至能够比人类更好地察觉出讽刺和暗示。 Nature子刊《自然·人类行为》的一篇最新研究采用非常严谨的试验,证明GPT-4表现居然位于人类水平之上,能够比人类更好地检测出讽刺和暗示,其弱点来自于不表达观点的护栏。 GPT-4心智优于人类 人们关心别人的想法,并花费大量精力思考别人的想法。 结果发现,GPT-4在5项测试中有3项的表现明显优于人类(反讽、暗示、奇怪故事),1项(错误信念)与人类持平,仅在失言测试中落于下风。 GPT-4在该测试中的表现明显优于人类,GPT-3.5的表现与人类没有明显差异,而Llama 2-70B的得分明显低于人类

    36810编辑于 2024-06-05
  • 来自专栏机器之心

    GPT-4能「伪装」成人类吗?图灵测试结果出炉

    Cameron Jones 和 Benjamin Bergen 在 652 位人类参与者的帮助下检验了 GPT-4 模仿人类的能力,结果发现表现最好的设置能达到 41% 的成功率,还不及随机乱猜,更不及人类水平的 下图展示了一些游戏示例: 成功率 成功率(SR)的定义是审问者认为一个见证者是人类(即见证者成功)的游戏场数的比例。人类见证者的表现最好,成功率为 63%(见图 4)。 这里测试的所有 AI 见证者都没达到 50% 的成功率,更不及人类水平(63%)了。因此,对于这里使用的 prompt,可以判定 GPT-4 没能通过图灵测试。 GPT-4 能通过图灵测试吗? 从图 4 可以看到,不同 prompt 得到的结果的差异很大。 研究者猜想:考虑到实验中探索的 prompt 有限,也许存在某个 prompt 能使 GPT-4 的成功率超过 50% 或人类基准。 最终,他们认为 GPT-4 没能通过图灵测试。 尽管如此,41% 的成功率也表明使用 AI 模型来进行欺诈已经有可能实现,尤其是当人类对话者没有提防对方可能并非人类时。

    64730编辑于 2023-11-02
  • 来自专栏帅云霓的技术小屋

    软硬件融合技术内幕 终极篇 (4) —— 人类历史的丰碑

    实际上,在人类看来,减法可以转换为加法,只要把被减数换成对应的负数(术语曰:相反数)。 如:2022-1926=96,可以转换为2022+(-1926) = 96。 让我们从人类视角和从计算机视角分别看。 从人类视角看,这是很简单的一个问题: 255+1 = 256 而从计算机视角看,算式是这样的: 具体到加法器的输入和输出则是这样的: 我们发现,在上图呈现的计算机加法器中,由于只能计算8bit数, 然而,只要人类文明还存在,伽罗华的名字和他开创的“群论”,就会永远流传下去。 可见,一个人无论是依靠自己的奋斗,还是同时考虑到历史的进程,只要为人类的进步做出过微小的贡献,无论人生的长度是21年还是96年,都将会永垂史册,铭刻在人类进步历史的丰碑。

    63540编辑于 2022-12-13
  • 来自专栏新智元

    GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4

    编辑:桃子 庸庸 【新智元导读】GPT-4通过图灵测试了!UCSD研究团队通过实证研究,人类无法将GPT-4人类进行区分。而且,有54%的情况下,它被判定为人类。 GPT-4可以通过图灵测试吗? 最近,来自UCSD的认知科学系研究人员发现: 在图灵测试中,人们根本无法区分GPT-4人类! 研究者Cameron R.Jones招募了500名志愿者,他们被分为5个角色:4个评估员,分别是GPT-4、GPT-3.5、ELIZA和人类,另一个角色就「扮演」人类自己,藏在屏幕另一端,等待着评估员的发现 为了测试人们是否有可能识破当前AI系统的欺骗行为,研究人员使用GPT-4进行了一次随机控制的双人图灵测试。 测试要求很简单,即人类参与者与人类、人工智能开启5分钟对话,并判断对话者是否是人类。 这意味着,人类在面对GPT-4时,成功分辨的概率跟抛硬币差不多!

    45210编辑于 2024-05-22
  • 来自专栏新智元

    44篇顶刊顶会论文!清华开源肖像线条画生成代码,惟妙惟肖模仿人类作画

    而这4篇论文有着相同的一作:易冉。 易冉现在是上海交通大学计算机系助理教授。她于2016年获得清华大学工学学士学位,2021年获得清华大学工学博士学位。 课题组部分成员合影 连续4年发表顶刊顶会论文 2022 论文链接:https://doi.org/10.1109/TPAMI.2022.3147570 代码链接:https://github.com 论文提出一种从人类感知数据中学习肖像线条画质量指标(quality metric)的方法。首先使用现有方法生成许多肖像线条画,并与艺术家的画作混合,收集的样本如下图所示。 通过用户实验收集人类对这些肖像线条画的偏好,由此计算得到每个肖像线条画的质量分数(quality score)。然后用这些数据训练一个回归网络,其输入为一幅肖像线条画,输出为该肖像线条画的质量分数。 该回归网络从人类评估数据中学习,因此其预测的分数可以帮助引导肖像画生成器生成更高质量的结果。 为训练质量度量模型收集的肖像线条画样本,包括生成的与艺术家绘制的肖像画。从上至下肖像画质量逐渐下降。

    73920编辑于 2022-03-04
  • 来自专栏新智元

    连夺4项第一!AI常识推理和人类又近了3%

    对于人类来说,用「常识」去解决问题这件事本身,就是一个「常识」。 然而对于现在的阅读理解AI来说,如果原文没有,那基本就算是「两眼一抹黑」了。 ACROSS模型通过借鉴人类的解题思路,先是收集了大量知识库和互联网的相关信息,然后在统一的语义空间中进行融合处理。最终,超大规模预训练模型便拥有了更强的知识输入,从而实现准确的常识知识推理。 不过,这个成绩仍远低于人类94.1%的水平,可见在常识性推理方向仍有很大挑战和进步空间。 并最终判断出两则新闻的相似程度,以1-4分打分。 比赛共涉及10种语言,分别为阿拉伯语、德语、英语、西班牙语、法语、意大利语、波兰语、俄语、土耳其语和中文。 4月21日,科大讯飞发布了2021年年报。 报告期内,公司实现营收超183亿元,同比增长40.61%,扣非归母净利润9.79亿元,同比增长27.54%,经营规模与效益持续增长。 

    74730编辑于 2022-04-28
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析(PacBio) (4)-- DeepVariant

    PacBio生信分析培训推荐DeepVariant作为SNP和INDEL变异检测的软件,并且对于小型变异检测PacBio官方推荐的也是DeepVariant(图4), 所以接下来我们详细介绍下DeepVariant :https://github.com/google/deepvariantDeepVariant是由谷歌Google基于深度卷积神经网络开发的一款从DNA测序数据中快速较精确识别碱基变异位点的软件(4) 20 \ --logging_dir=/output/HG004_DeepV_logs \ --haploid_contigs="chrX,chrY" &# nohup 挂起不间断# &放入后台运行4. 对于大规模群体/队列而言(主要针对人类基因组开发),是个非常好的工具(5)。Deepvariant 和 Clara Parabricks 都推荐它来做联合变异(5)。

    2.4K21编辑于 2023-11-12
  • 来自专栏新智元

    100:87:GPT-4心智碾压人类!三大GPT-3.5变种难敌

    GPT-4在推理基准测试中准确率可高达100%,而人类仅为87%。 GPT-4的心智理论,已经超越了人类! 论文地址:https://arxiv.org/abs/2304.11490 在一些测试中,人类的水平大概是87%,而GPT-4,已经达到了天花板级别的100%! · GPT-4是截至2023年4月的最新GPT模型。关于GPT-4的规模和训练方法的细节很少公布,然而,它似乎经历了更密集的RLHF训练,因此与人类意图更加一致。 测试结果是,人类在Photo场景的准确率为(86%±4%),ToM场景的准确率为(87%±4%)。 LLM 因为LLM是个概率模型,因此研究者对每个模型prompt了20次。 而在这些情况下,人类的表现为87%(±4%)。 在实验中,研究者注意到这样一个问题:LLM ToM测试成绩的提高,是因为从prompt中复制了推理步骤的原因吗?

    32220编辑于 2023-05-09
  • 来自专栏DrugOne

    KG4SL:用于人类癌症合成致死预测的知识图神经网络

    结果:本文提出了一种新的基于图神经网络(GNN)的KG4SL模型,将知识图(KG)消息传递纳入到图神经网络预测中。 4.实验结果 1.与baseline方法的比较 作者将KG4SL与多种baseline方法比较,分别是SL2MF,GRSMF,HOPE,DeepWalk,Node2Vec,LINE,GCN,GraphSAGE 在SynLethKG上,KG4SL优于表中所示的所有baseline方法,与第二优模型GRSMF相比,KG4SL在AUC、AUPR和F1上的性能分别提高了3.11%、2.16%和6.4%。 KG4SL模型在嵌入维数为256时已经有了很好的性能。太大的嵌入维度会给内存和计算带来负担。最终,作者设置KG4SL模型的邻居采样大小为64,嵌入维数为256。 另一方面,虽然“TransE+GCN”和KG4SL都与KG集成,但KG4SL能够更好地利用这一信息,更彻底地分离两种类型的链接。

    1.9K30发布于 2021-07-28
  • 来自专栏芯智讯

    OpenAI发布多模态模型GPT-4:已经能在SAT考试中击败90%人类

    这也使得GPT-4 在能力、范围和潜力方面相比GPT-3,将拥有一个质的飞跃。 OpenAI 指出,相较前一代的GPT-3.5, GPT-4在许多专业测试中表现出超过绝大多数人类的水平。 在美国法学院毕业生参加的律师资格考试中,旧模型得分在应试者中排名后10%,而新模型得分在应试者中排名约前10%,即击败了约90%的人类。 不仅能够产生更少的错误答案,更少地偏离话题,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。“在我们的内部评估中,它产生正确回应的可能性比GPT-3.5高40%。” 不过,OpenAI也警告称,GPT-4还不完美,在许多情况下,它的能力不如人类。它仍然存在“幻觉”或自己编造的主要问题,而且在事实问题上并不可靠。它仍然倾向于在错误的时候坚持自己是正确的。 OpenAI CEO Sam Altman 在Twitter 上表示GPT-4 是最有能力和符合人类价值观和意图的模型,尽管它仍具有缺陷。

    64840编辑于 2023-03-24
  • 来自专栏大数据文摘

    技术的顶点,是普惠人类还是超越人类

    我们真的相信技术比人类更复杂和必要吗?被创造的东西真的能取代它的创造者吗?我们必须共同决定,是在宏伟技术的帮助下为人类建设更美好的未来,还是以牺牲人类为代价建设一个更好的技术的未来。 人类损失惨重,但事实上,人类遭受的持久伤害早在1945年夏天之前就已经开始了,恰好在50年前的1895年,当时的一系列科学发现让我们把技术提升到了人类之上。 ? 机器人与人类女孩 有些人认为,我们应该无条件地把对人类未来的控制权交给机器。 人类的精神和愿望的本质是自由:做自己的自由,表达个人信念的自由,以及成为我们能成为的最好的自己的自由。事实上,我们不仅是人类,还是进化中的人类。 数千年的人类历史提供了一个显而易见的答案,这个答案将我们与其他所有生命形式区分开来:人类渴望繁荣、进步,渴望变得比现在更好。 ?

    67221发布于 2021-02-08
  • 来自专栏新智元

    GPT-4创造力竟全面碾压人类!最新创造力测试GPT4排名前1%

    新智元报道 编辑:拉燕 【新智元导读】最新研究发现,GPT-4的创造力全方位持平或碾压人类。 最近,一项有关GPT-4的创造力思维测试火了。 包括蒙大拿大学和西澳大学教授在内的一个研究小组发现: OpenAI的GPT-4在托伦斯创造性思维测试(TTCT)中的得分在前1%,在流畅性、灵活性和原创性等创造性能力方面与人类相匹配或超过了人类。 对于他们与GPT-4的最新研究项目,研究人员对评估其与人类创造力相比的创造能力感兴趣。 GPT-4通过ChatGPT使用TTCT的两个变体进行了八次测试,TTCT是研究人员评估创造力的黄金标准。 在所有八项测试中,GPT-4在流畅性方面的得分都在所有人类反应的前1%,即对每项活动展现出了大量反应的能力。 他担心类似GPT-4、DALL-E等工具会稀释人类的创造力。 换句话说,不会再有真正新的东西被创造出来,产生的东西都是把既有的东西拆分重组。

    26110编辑于 2023-08-07
  • 来自专栏一个正经的测试

    超越GPT-4?Claude 3的智商等于一名人类本科生!

    根据该公司的基准测试,其研究生水平推理能力在测试时得分为 50.4%,而 GPT-4 的得分为 35.7%。 “至少根据评估,Claude 3 Opus 在许多方面都是世界上在一系列任务中表现最好的模型,” 同时官方认定,Claude 3 Opus相当于一名人类本科生的水平 这里随机抬走一名清澈愚蠢的大学生 最大的新模型 有人说,Claude 3 Sonnet 解出了一道此前只有 GPT-4 才能解开的谜题。 不过,也有人表示,在实际体验方面,Claude 3 并没有彻底击败 GPT-4。 一些用户在实验中将基础的ASCII码直接输入给Claude模型,结果发现该模型可以毫无困扰的处理这些输入: 真的,Claude 3 有比 GPT-4 更强的代码能力 四、 总结 虽然比起GPT-4,强大了很多 但是,说真的,GPT-4已经是去年的东西了 从目前的评测基准和体验看来,Claude 3 在智能水平、多模态能力和速度上都取得了长足的进步。

    50410编辑于 2024-03-06
  • 来自专栏量子位

    GPT-4人类更懂融资!AI企划书让VC疯狂打call

    AI融资成功率是人类3倍 最近,美国金融咨询公司Clarify Capital搞了个有趣的实验。 他们准备了两份融资企划书,一份由GPT-4生成,一份由人类撰写。 最终,80%的VC和企业主认为GPT-4生成的更有吸引力,只有39%倾向人类撰写的。 AI生成的融资企划书被投可能性是人类的三倍! 结果,GPT-4不仅轻松拿捏,生成内容一如既往的高质。 在金融领域,88%的投资人和企业主认为GPT-4生成内容比人类撰写更有说服力。科技行业这一比例也高达70% 。 令人惊讶的是,即使是在不缺创意人才的营销行业,GPT-4也吊打人类,比例高达73%。 网友:以后就用AI融钱 自ChatGPT横空出世,AI取代人类的声音就不绝于耳。 不禁让一票网友感叹:融钱这块,AI将可能取代人类

    25550编辑于 2023-08-04
  • 来自专栏新智元

    【星际争霸人类战胜机器】韩国选手4:0战胜Facebook等机构AI

    【新智元导读】 韩国的专业玩家在星际争霸游戏中以4:0的比分战胜了AI。 在人与AI最近的一次遭遇战中,韩国的专业玩家在星际争霸游戏中以4:0的比分战胜了AI。比赛于本周二在韩国的世宗大学举行。 例如,AI 每分钟的按键次数峰值可以达到20000次,这是一个衡量玩家对游戏控制速度的指标,但是在人类玩家的平均速度只有每分钟300次。 “虽然有些时候,看起来AI确实像人类一样在玩这一游戏,但是我觉得他们还没有学会人类玩家的不断变化的控制和判断。”Song在4:0获胜后说。 “如果专业玩家参与到这些AI的训练中来,我认为会带来巨大的提升、一旦AI的技巧更为熟练,我认为未来AI会是这一游戏中对人类专业玩家来说很强的对手。”他说。 韩国科技大学计算机科学和工程教授郑汉敏(Jung Han-min)说:“当AI Bot 配备了像AlphaGo这样的(高级别)决策系统时,人类就无法获胜。

    71850发布于 2018-03-21
  • 来自专栏图灵人工智能

    人类简史》尤瓦尔:人工智能会消灭人类吗?

    随着时间的推移,不仅是因为算法变得更聪明,也是因为人类逐渐走向专业化,所以用计算机来取代人类越来越容易; 随着算法将人类挤出就业市场,财富和权力可能会集中在拥有强大算法的极少数精英手中; 那么,未来算法或者科技会将如何影响社会以及人类自身 这时,如果输入4和8,结果就是6;输入117和231,结果就是174。 食谱是个复杂一点的例子。例如蔬菜汤的算法,大概会是这样: 1. 在锅中热油。 2. 将洋葱切成碎末。 3. 4. 把马铃薯切块,加入锅中。 5. 将圆白菜切丝,加入锅中。 诸如此类。你可以尝试着不断重复这种算法,每次用稍微不同的蔬菜,就会得到稍微不同的汤。然而,算法本身并没有改变。 20世纪80年代讨论到人类的独特之处时,很习惯用国际象棋作为人类能力更强的主要证据。他们相信计算机永远不可能在国际象棋领域打败人类。 2016年3月,AlphaGo和韩国棋王李世石在首尔举行了一场比赛,AlphaGo凭借出奇的下法、创新的战略,以4比1击败李世石,令各方大跌眼镜。

    53230编辑于 2023-10-24
  • 来自专栏奇点大数据

    AI预测人类寿命?

    不过,目前来说大部分分析研究还是集中在对人类基因组的测序和分析上。但是,遗传因素对于预测诸如心脏病、癌症、糖尿病等慢性疾病风险的帮助不大。研究显示,引起这些疾病的因素中70-90%与遗传无关。 通过与实际情况比对,这个算法预测的准确率达到了70%,这一数字与人类专家的预测成功率一样准确。 ?

    1.1K30发布于 2018-07-24
  • 来自专栏机器人网

    人类的终极产业

    我与机器人的故事可以讲很多,因为这是我业余关注度最高的课题,这种关注的结果是我得出了一个现代人还难以接受的观点,那就是:机器人产业将是人类的终极产业。 我的这份执着来源于我坚信机器人产业将是人类的终极产业。只有那些尽早介入的企业可以占得先机。且不说战争会由机器人替代士兵,也不说危险沉重的单调的劳动会由机器人担当。 人类最终将所有原来由人从事的劳动交由机器人打理。人类的工作是开发更多的机器人和保养维护它们。人类还有更多需要创意的事去做,成熟的工作全交由机器人。 创意是人类生存的最大理由,包括微观世界、医疗、外太空和其他星球开发等许多动脑的事,人类还得做下去。但大多数常务工作由机器人担当了,一个满街行走着机器人的世界,迟早会到来。

    52340发布于 2018-04-24
  • 来自专栏作图丫

    NATURE|人类突变特征

    结果证实使用NMF-based方法提取突变特征并不是一个纯粹的算法过程,还需要考虑实验确定突变特征的证据和DNA损伤和修复相关文献说明,之前的生物学合理性和人类引导的敏感性分析证据证实了从不同的肿瘤组中提取的结果是一致的 图4 03 双碱基替换特征 双串联、三联体、四联体、五联体和六联体的碱基置换约占SBSs患病率的1%。 DBS2表现出鸟嘌呤损伤的转录链偏位,并与烟草烟雾暴露引起的SBS4相关。因此,DBS2可能是烟草-烟雾诱变剂破坏DNA的结果。 在与吸烟无关的人类癌症和健康小鼠中,构成这些特征的突变过程的性质尚不清楚。 这两种缺失模式可能是DNA双链断裂修复的特征,这种修复是基于非同源重组的末端连接机制,如果是这样,这表明至少有两种不同的形式在人类癌症中起作用。

    2.9K20编辑于 2022-03-29
领券