巴蜀网

 找回密码
 免费注册

QQ登录

只需一步,快速开始

同板块主题的 前一篇 同板块主题的 后一篇
开启左侧
查看: 196|回复: 0
1# 贡嘎山
跳转到指定楼层

[2023年ICML2023杰出论文大幅减少至6篇,北大、武理工校友获奖,大模型水印受青睐

 [复制链接]
源自:机器之心Pro
  机器之心报道 编辑:杜伟、小舟
  相比去年评出的 15 篇杰出论文,ICML 2023 的获奖论文数量大大减少,只有 6 篇。
  ICML 全称是 International Conference on Machine Learning,由国际机器学习学会(IMLS)举办,是计算机人工智能领域的顶级会议。今年的 ICML 大会已是第 40 届,于 2023年 7月 23日至 29日在美国夏威夷会议中心举行。
  今年,ICML 共收到 6538 份投稿,其中 1827 份被接收,接收率约为 27.9%。相较于 2022年,本届的投稿、接收论文数量以及接收率都有所增加(投稿 5630 篇、接收短论文 1117 篇、长论文 118 篇、接收率 21.9%)。
  ICML 官方表示,每一份投稿都由领域主席和高级领域主席进行评审,以确保每一份投稿都得到适当的评估。
  今日,ICML 官方放出了杰出论文奖获奖论文。
  六篇杰出论文奖
  本届会议共评出了 6 篇杰出论文,研究覆盖了无学习率、为 LLM 加水印、未见过域泛化、不完全信息零和博弈的近优策略、MCMC 和频率顺序学习的贝叶斯设计原则等课题。
  论文 1:Learning-Rate-Free Learning by D-Adaptation

  •   机构:Meta AI、Inria Sierra
  • ⊙作者:Aaron Defazio、Konstantin Mishchenko(现为三星人工智能中心研究科学家)

  •   论文地址:https://openreview.net/forum?id=GXZ6cT5cvY
  该研究旨在为非光滑随机凸优化获取无学习率的最优界限,所提方法克服了优化此类问题时传统学习率选择的限制,为优化领域做出了有价值且实际的贡献。
  该研究还提出了新方法的 SGD 和 Adam 变体,将用于大规模CV 和 NLP 问题。
  论文 2:A Watermark for Large Language Models

  •   机构:马里兰大学
  • ⊙作者:John Kirchenbauer、Jonas Geiping、Yuxin Wen、Jonathan Katz、Ian Miers、Tom Goldstein

  •   论文地址:https://openreview.net/forum?id=aX8ig9×2a7
  论文简介:该论文提出了一种对大型语言模型的输出添加水印的方法──将信号嵌入到生成的文本中,这些信号对人类来说是不可见的,但可以通过算法检测到。无需重新训练语言模型即可生成水印,无需访问 API 或参数即可检测水印。
  为了检测水印,该论文还提出了一种具有可解释 p 值的统计测试方法,以及用于分析水印敏感度的信息论框架。该研究所提方法简单新颖,并提供了彻底的理论分析和扎实的实验。鉴于检测和大型语言模型(LLM)生成的文本正面临严峻的挑战,该研究可能会对机器学习社区产生重大影响。
  论文 3:Generalization on the Unseen,Logic Reasoning and Degree Curriculum

  •   机构:EPFL、苹果
  • ⊙作者:Emmanuel Abbe、Samy Bengio、Aryo Lotfi、Kevin Rizk

  •   论文地址:https://openreview.net/forum?id=3dqwXb1te4
  论文简介:该论文在布尔函数的学习方面取得了重要进展,尤其是针对未见过域的泛化(Generalization on the Unseen,GOTU),这是一个具有挑战性的分布外泛化问题。该论文深入探究了这一课题,提出了一种结构良好的方法,并有充足的理论分析和大量实验支撑。此外该论文还概述了深度神经网络领域的一个关键研究方向。
  具体而言,研究者探究了具有 holdout 的函数学习问题,其中部分分布支持在训练中几乎或从来没有见过,并使用布尔目标函数来捕捉各种推理任务(如算术、决策树和逻辑电路)的离散和组合属性。
  最终,研究者对长度泛化问题给出了自己的解释,并提出了一种名为「Degree-Curriculum」的课程式学习算法,该算法通过增加支持更高效地学习单项式。算法如下所示:
  论文 4:Adapting to game trees in zero-sum imperfect information games

  •   机构:CREST、ENS Lyon、Omron Sinic X、Deepmind 等
  • ⊙作者:Cme Fiegel、Pierre MENARD、Tadashi Kozuno、Remi Munos、Vianney Perchet、Michal Valko

  •   论文地址:https://openreview.net/forum?id=O1j4uFuSVW
  论文简介:该论文介绍了不完全信息零和博弈的近优策略。研究者建立了一个新颖的下界,并提出了两种算法— 平衡 FTRL 和自适应 FTRL。这些贡献极大地推动了不完全信息博弈优化领域的发展。论文的多项实验证实了这些说法,为研究结果提供了充分的支持。
  论文 5:Self-Repellent Random Walks on General Graphs-Achieving Minimal Sampling Variance via Nonlinear Markov Chains

  •   机构:IQVIA Inc、北卡罗来纳州立大学
  • ⊙作者:Vishwaraj Doshi、Jie Hu、Do Young Eun

  •   论文地址:https://openreview.net/forum?id=450iImFM4U
  论文简介:该论文解决了一组具有挑战性的开放问题,提出了具有自排斥随机游走的马尔可夫链蒙特卡洛(MCMC)。给定任何对应目标概率分布的马尔可夫链,这种自排斥随机游走(SRRW)不太可能过渡到过去高访问量的节点,而更有可能过渡到很少访问的节点。
  该方法超越了传统的无回溯方法,并为 MCMC 采样的新研究方向铺平了道路。研究者为 MCMC 研究做出了原创性和重大的贡献,更值得一提的是过程可以被严格地分析和证明。结果也非常全面,令人信服。
  这篇论文的作者之一 Jie Hu,现为北卡罗来纳州立大学博士生,他在武汉理工大学获得了本科学位,在美国西北大学获得了硕士学位。
  论文 6:Bayesian Design Principles for Frequentist Sequential Learning
『 巴蜀网 』提醒,在使用本论坛之前您必须仔细阅读并同意下列条款:
  1. 遵守《全国人大常委会关于维护互联网安全的决定》及中华人民共和国其他各项有关法律法规,并遵守您在会员注册时已同意的《『 巴蜀网 』管理办法》;
  2. 严禁发表危害国家安全、破坏民族团结、破坏国家宗教政策、破坏社会稳定、侮辱、诽谤、教唆、淫秽等内容;
  3. 本帖子由 太白山 发表,享有版权和著作权(转帖除外),如需转载或引用本帖子中的图片和文字等内容时,必须事前征得 太白山 的书面同意;
  4. 本帖子由 太白山 发表,仅代表用户本人所为和观点,与『 巴蜀网 』的立场无关,太白山 承担一切因您的行为而直接或间接导致的民事或刑事法律责任。
  5. 本帖子由 太白山 发表,帖子内容(可能)转载自其它媒体,但并不代表『 巴蜀网 』赞同其观点和对其真实性负责。
  6. 本帖子由 太白山 发表,如违规、或侵犯到任何版权问题,请立即举报,本论坛将及时删除并致歉。
  7. 『 巴蜀网 』管理员和版主有权不事先通知发帖者而删除其所发的帖子。
社会政治内的理论与实践、连续与间断 如何基于Llama 2搭建自己的大模型?8月26日,4位技术大牛手把手教你
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

© 2002-2024, 蜀ICP备12031014号, Powered by 5Panda
GMT+8, 2024-5-10 07:39, Processed in 0.202801 second(s), 12 queries, Gzip On, MemCache On
同板块主题的 后一篇 !last_thread! 快速回复 返回顶部 返回列表