巴蜀网

 找回密码
 免费注册

QQ登录

只需一步,快速开始

同板块主题的 前一篇 同板块主题的 后一篇
开启左侧
查看: 364|回复: 0
1# 贡嘎山
跳转到指定楼层

[2023年模型大乱斗,小羊驼团队推出大模型竞技平台Chatbot Arena

 [复制链接]
源自:PingWest品玩
  品玩6月8日消息,由伯克利大学主导一个团队 LMSYS Org 近日发布了一个针对大语言模型的基准平台 Chatbot Arena。
  据悉,该平台采用匿名、随机的方式进行对抗评测,评测方式基于国际象棋等竞技游戏中广泛使用的 Elo rating system。排名通过用户投票产生,系统每次会随机选择两个不同的大模型机器人和用户聊天,并让用户在匿名的情况下判定哪款大模型产品的表现更好一些。Elo rating system会根据用户的选择最后判定大模型产品的积分,并以排行榜的形式出现在首页中。
  目前OpenAI 的ChatGPT-4排名第一,之后是 Anthropic 的claude,同样来自 Anthropic 的 claude Instant 排名第三。
  LMSYS Org 是一个松散的研究组织,由加州大学伯克利分享额学生团队组建,曾推出过大语言模型小羊驼。
『 巴蜀网 』提醒,在使用本论坛之前您必须仔细阅读并同意下列条款:
  1. 遵守《全国人大常委会关于维护互联网安全的决定》及中华人民共和国其他各项有关法律法规,并遵守您在会员注册时已同意的《『 巴蜀网 』管理办法》;
  2. 严禁发表危害国家安全、破坏民族团结、破坏国家宗教政策、破坏社会稳定、侮辱、诽谤、教唆、淫秽等内容;
  3. 本帖子由 大坳山 发表,享有版权和著作权(转帖除外),如需转载或引用本帖子中的图片和文字等内容时,必须事前征得 大坳山 的书面同意;
  4. 本帖子由 大坳山 发表,仅代表用户本人所为和观点,与『 巴蜀网 』的立场无关,大坳山 承担一切因您的行为而直接或间接导致的民事或刑事法律责任。
  5. 本帖子由 大坳山 发表,帖子内容(可能)转载自其它媒体,但并不代表『 巴蜀网 』赞同其观点和对其真实性负责。
  6. 本帖子由 大坳山 发表,如违规、或侵犯到任何版权问题,请立即举报,本论坛将及时删除并致歉。
  7. 『 巴蜀网 』管理员和版主有权不事先通知发帖者而删除其所发的帖子。
易纲:有信心、有能力、有条件实现今年“两会”确定的预期增长等目标 接力出版社童书绘本《爸爸的大手》父亲节前温暖上市
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

© 2002-2024, 蜀ICP备12031014号, Powered by 5Panda
GMT+8, 2024-5-13 02:12, Processed in 0.124800 second(s), 12 queries, Gzip On, MemCache On
同板块主题的 后一篇 !last_thread! 快速回复 返回顶部 返回列表