今年知识发现与数据挖掘会议(KDD)的大会主席分享了他对会议议程最兴奋的内容。
作者:Larry Hardesty
2022年8月11日
4分钟阅读
作为今年ACM知识发现与数据挖掘会议(KDD)的大会主席,某机构机器学习解决方案实验室的高级经理Huzefa Rangwala对会议讨论的主题有着广泛的视角。他表示,其中最突出的两个主题是图神经网络和AI公平性。图是一种可以编码不同数据项之间关系的数据表示形式,而图神经网络是机器学习模型,由于可用于推断图结构,因此对知识发现非常有用。
“我们的世界以多种方式相互连接,因此你会看到图神经网络在从社交网络、交通网络到知识图谱和药物发现的许多不同领域中找到应用,”Rangwala说。
某机构的机器学习解决方案实验室将某机构科学家的专业知识和某机构云服务的资源应用于客户的机器学习问题。在加入某机构之前,Rangwala曾担任某大学的计算机科学教授,专注于机器学习的跨学科应用,特别是在生物医学、学习科学和社会科学领域。同样,他在机器学习解决方案实验室的团队与各行各业(包括医疗保健、生命科学、体育和制造业)的客户合作。
“我们正在使用图神经网络来表示大分子(如蛋白质)及其相互作用伙伴,”Rangwala说。“因此,我们本质上是在用图神经网络加速药物发现或寻找新的生物疗法。我们已经将这种方法部署给了我们的客户之一——某制药公司。”
“尚未解决的关键问题之一是如何接收蛋白质等输入,并将其转换为这些图结构的表示形式。这是第一步:如何以稳健的方式构建特征,从而获得良好结果。”
“其他一些开放挑战与深度学习中的常见挑战类似:如何确保最终结果具有可解释性和鲁棒性?最终,终端用户可能不会只满足于预测分数,他们还想知道为什么预测是合理的。”
“在KDD会议上,有许多关于如何扩展、如何高效运行和训练这些模型的想法,随着数据集变得更大、交互数量增加以及表示形式变得更大,这些方法包括并行化方法、使用高效数据结构的方法,以及开发新的公式和计算机架构以在这些结构上良好运行的方法。”
“但真正让我兴奋的是,我们看到如此多的应用——蛋白质、分子、信息提取、推荐、异常检测——所有这些都能带来更好的科学和商业成果。这就是围绕这些技术所面临的挑战和令人兴奋之处。”
理论到实践
Rangwala表示,实际上,KDD会议上展示的应用广度对他来说正是该会议的主要吸引力之一。
“我真的喜欢应用科学。我不局限于某一种特定方法或某个特定领域。我最感兴趣的是如何利用这些计算和机器学习技术来解决具有挑战性的问题,”Rangwala说。
“我对KDD会议最兴奋的是,它不仅展示了核心数据科学方法的创新,而且许多研究人员专注于如何使用这些方法,”Rangwala说。“如何从理论走向实践?如何将机器学习研究成果转化为终端用户可用的工具?”
“首先,即使在研究轨道上,也有很多跨学科的工作。并且多年来,KDD设有应用数据科学轨道,因此你不仅能看到前沿研究,还能看到转化研究——了解这些方法是如何应用的。”
“这适合我的背景,因为我真的喜欢应用科学。我不局限于某一种特定方法或某个特定领域。我最感兴趣的是如何利用这些计算和机器学习技术来解决不同领域的挑战性问题,无论是物理学、生物学、化学,还是社会科学。”
可信计算
Rangwala解释说,在知识发现领域,与许多与机器学习相关的其他领域一样,公平性近年来已成为一个突出的研究课题。
“可信赖性对于AI技术的采用和实现其对社会潜在收益至关重要。可信赖意味着它们需要公平、可解释,并且可复现。”
“对此存在很多讨论:是数据有偏见,还是社会本身有偏见?我认为整个领域都意识到这些问题,并提出了正确的问题——例如,构建审计方法或缓解方法。最重要的是,他们赋权不同的利益相关者(开发者、决策者和最终用户)来补充已开发的解决方案,并确保算法的可信赖性。”
“在KDD会议上,有一个专门讨论这一主题的日子,称为‘可信AI日’。此外,如果你查看研究轨道,也有很多关于这些主题的会议。”
“我还想强调‘KDD中的女性’活动。这真的很令人兴奋,因为这是第一次线下举办。Judith Spitz(某机构的创始人)与某研究机构的Johannes Gehrke共同主持该活动,计划举办交流午餐会,并听取嘉宾讲述职业历程,特别是针对KDD中的女性及非二元性别个体。这是我很热衷的事情——如何建立一个更具包容性的社区。”
研究领域
机器学习
标签
KDD、图神经网络、负责任的AIFINISHED
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。