巴蜀网

 找回密码
 免费注册

QQ登录

只需一步,快速开始

同板块主题的 前一篇 同板块主题的 后一篇
开启左侧
查看: 320|回复: 0

[2023年如何基于Llama 2搭建自己的大模型?8月26日,4位技术大牛手把手教你

 [复制链接]
源自:机器之心Pro
  如果要问「2023年最火的动物是什么?」AI 圈外的人可能会回答「熊猫」,并给你列出一长串熊猫的名字。而 AI 圈内的人八成会回答「羊驼」。而且,他们也能给你列出一长串「羊驼」的名字:llama、vicuna、alpaca……
  得益于 Meta Llama 模型的开源,AI 社区的研究者对生物学羊驼属的英文单词已经如数家珍,每个单词都对应着一个(或一组)基于 Llama 的微调模型。这些模型各有所长,在 Llama 的基础上提升了对话、多模态生成等能力,而且更符合人类对话习惯。不过,由于存在开源协议问题,第一版 Llama 一直不可以商用,这让一些想基于该模型构建应用的从业者持谨慎态度。
  就在前几天,Meta 又开源了 Llama 2,性能更加接近 ChatGPT,而且允许商用(日活超过 7亿需要单独申请)。这意味着未来更多人会加入 Llama 阵营,基于这一模型进行微调,并构建商业应用。有人预言说,大模型的安卓时代就要来了!
  在这样一个激动人心的时刻,不少从业者已经摩拳擦掌,准备做出一些成果。不过,在此之前,每个人都需要先把 Llama 2 背后的技术吃透,同时了解其潜在的应用场景。这会让大家在之后的模型、应用构建之路上走得更顺。
  为此,机器之心专门设计了「Llama 2 大模型算法与应用实践」论坛。
  论坛邀请到上海交通大学清源研究院长聘教轨副教授、生成式人工智能研究组(GAIR)负责人刘鹏飞,老刘说 NLP 技术公众号作者、开源爱好者刘焕勇,北京灵琐科技 CEO、Chinese Llama 2 7B 项目发起人史业民,前智源研究院技术总监苏洋等四位专家带来演讲及实战分享。
  论坛为期 1 天,内容包括 Llama 2 算法解读、基于 Llama 2 开发中文大模型、Llama 2 案例解读和应用实践等。
  通过本场系统分享,你将系统了解到 Llama 2 背后的技术以及潜在的应用场景,为即将到来的「大模型安卓时代」做好准备。
  4 位资深主讲人,做过哪些相关工作?
  主讲人:刘鹏飞,上海交通大学清源研究院长聘教轨副教授、生成式人工智能研究组(GAIR)负责人
  个人简介:专注于自然语言的预训、生成和评估等研究方向;在自然语言处理和人工智能领域发表学术论文 60 余篇。谷歌学术引用 7000 余次。ACL 会议史上首次实现连续两年获得 System & Demo Paper Award;提示工程(Prompt Engineering)概念最早提出者之一。代表作包括:ExplainaBoard,高考英语 AI,LIMA 等工作。
  Google Scholar:https://scholar.google.com/citations?hl=en&user=oIz_CYEAAAAJ
  GitHub 个人主页:https://github.com/pfliu-nlp
  主讲人:刘焕勇,老刘说 NLP 技术公众号作者、开源爱好者
  个人简介:曾就职于中国科学院软件研究所。主要研究方向为领域知识/事件图谱的构建与应用,大模型的数据工程、知识库增强与自动化评估,申请发明专利十余项、论文数篇。近年来在 OGB-Wikikg 2、CCKS多模态实体对齐、可解释类案匹配等评测中获得多项冠亚军。致力于自然语言处理技术开源共享,在 GitHub 开源项目 60+,收获 star 数超 2W+,创立「老刘说 NLP」技术公众号,具有广泛影响力。
  GitHub 个人主页:https://liuhuanyong.github.io
  主讲人:史业民,北京灵琐科技 CEO、Chinese Llama 2 7B 项目发起人
  个人简介:本科及博士毕业于北京大学,入选斯坦福大学发布的 2022年度「全球前 2% 顶尖科学家榜单」,在人工智能领域顶会和学术期刊上发表论文 20 余篇;作为智源研究院 Z-lab 联合负责人,从事大模型相关算法研究与应用探索,参与了智源悟道 3.0 研发,是最大可商用中文指令数据集 COIG、COIG-PC 的发起者、组织者之一,也是音乐预训练大模型 MERT 的作者之一,曾获 CAMEO 蛋白质结构预测年度、季度、月度第一名。
  GitHub 项目地址:https://github.com/LinkSoul-AI/Chinese-Llama-2-7b
  主讲人:苏洋,前智源研究院技术总监
  个人简介:Llama 2 中文开源模型社区贡献者。GitHub 社区活跃用户,国内首个 Llama 2 中文版开源社区贡献者,GitHub 热榜八十行代码实现类似 Midjourney 官方 Describe 开源工具作者,双卡 Finetune Llama 一代 65B 模型,早期 ChatGPT 应用 「hacker」,实现了 ChatGPT 自由接入数据源等工具。
  GitHub 个人主页:https://github.com/soulteary
  现在报名可享「8折早鸟福利」
  「Llama 2 大模型算法与应用实践」论坛致力于呈现高质量、高水准内容,正在根据 Llama 2 最新进展严格打磨选题及内容,欢迎通过机器之心公众号持续关注。

  •   专业的大模型技术解析和最佳实践案例分享
  •   与技术大牛面对面交流的珍贵机会
  •   加入大模型高质量社群,及时跟进行业前沿资讯
  •   活动现场视频会后无限回看权限
  •   机器之心旗下相关付费活动享购票八五折优惠
  ……
『 巴蜀网 』提醒,在使用本论坛之前您必须仔细阅读并同意下列条款:
  1. 遵守《全国人大常委会关于维护互联网安全的决定》及中华人民共和国其他各项有关法律法规,并遵守您在会员注册时已同意的《『 巴蜀网 』管理办法》;
  2. 严禁发表危害国家安全、破坏民族团结、破坏国家宗教政策、破坏社会稳定、侮辱、诽谤、教唆、淫秽等内容;
  3. 本帖子由 圆圆的汤圆 发表,享有版权和著作权(转帖除外),如需转载或引用本帖子中的图片和文字等内容时,必须事前征得 圆圆的汤圆 的书面同意;
  4. 本帖子由 圆圆的汤圆 发表,仅代表用户本人所为和观点,与『 巴蜀网 』的立场无关,圆圆的汤圆 承担一切因您的行为而直接或间接导致的民事或刑事法律责任。
  5. 本帖子由 圆圆的汤圆 发表,帖子内容(可能)转载自其它媒体,但并不代表『 巴蜀网 』赞同其观点和对其真实性负责。
  6. 本帖子由 圆圆的汤圆 发表,如违规、或侵犯到任何版权问题,请立即举报,本论坛将及时删除并致歉。
  7. 『 巴蜀网 』管理员和版主有权不事先通知发帖者而删除其所发的帖子。
ICML2023杰出论文大幅减少至6篇,北大、武理工校友获奖,大模型水印受青睐 出台28条政策 成都多措并举推动科技成果转化
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

© 2002-2025, 蜀ICP备12031014号, Powered by 5Panda
GMT+8, 2025-5-7 18:39, Processed in 0.062400 second(s), 10 queries, Gzip On, MemCache On
同板块主题的 后一篇 !last_thread! 快速回复 返回顶部 返回列表