还在为玩不了ChatGPT苦恼?这十几个开源平替也能体验智能对话
日期:2023-03-20 16:07:46 来源:机器之心
机器之心报道
机器之心编辑部
距离 ChatGPT 的最初发布,过去差不多四个月的时间了。在这期间,ChatGPT 的惊艳表现,让人直呼 AIGC 是不是要提前实现了。 不过众所周知的一个秘密是,ChatGPT 不大可能开源,加上巨大的算力投入以及海量的训练数据等,都为研究界复制其实现过程设下重重关卡。 面对 ChatGPT 的来势汹汹,开源平替是一个不错的选择,它们在实现相似功能的同时,还能让你通过替代品了解 ChatGPT 的运行机理。 随着技术的进步,现在已经出现了许多其他类似于 ChatGPT 的新 AI 模型。本文我们将为大家盘点一下 ChatGPT 的开源平替项目。内容将分为两部分,一部分为类 ChatGPT 开源项目汇总,另一部分是对该项目汇总的补充。 项目汇总项目作者 nichtdax 整理了 9 个开源的 ChatGPT 平替项目。接下来会一一介绍。 项目地址:https://github.com/nichtdax/awesome-totally-open-chatgpt PaLM-rlhf-pytorch第一个项目是「PaLM-rlhf-pytorch」,项目作者为 Phil Wang。该项目是在 PaLM 架构之上实现 RLHF(人类反馈的强化学习),它基本上是使用 PaLM 的 ChatGPT。 该项目已在 GitHub 上获得了 5.8k 的 Stars。 项目地址:https://github.com/lucidrains/PaLM-rlhf-pytorch 下图为训练流程。 OpenChatKit第二个项目是「」,它提供了一个强大的的开源基础,为各种应用程序创建专用和通用的聊天机器人。该 kit 包含了一个经过指令调优的 200 亿参数语言模型、一个 60 亿参数调节模型和一个涵盖自定义存储库最新响应的可扩展检索系统。 OpenChatKit 是在 OIG-43M 训练数据集上训练的,该数据集是 Together、LAION 和 Ontocord.ai 三者的联合。项目作者表示,这不仅仅是一个模型的发布,还是一个开源项目的开始。他们正在发布一套工具和流程,并通过社区贡献持续改进。 该项目已在 GitHub 上获得了 5.7k 的 Stars。 项目地址:https://github.com/togethercomputer/OpenChatKit text-generation-webui第三个项目是「text-generation-webui」,它是一个用于运行 GPT-J 6B、OPT、GALACTICA、LLaMA 和 Pygmalion 等大语言模型的 gradio web UI。该项目旨在成为文本生成领域的 AUTOMATIC1111/stable-diffusion-webui。 功能包括使用下拉菜单在不同模型之间切换、提供类似于 OpenAI playground 的笔记本模式、用于对话和角色扮演的聊天模式、为 GPT-4chan 生成漂亮的 HTML 输出等等。 该项目已在 GitHub 上获得了 3.4k 的 Star。 项目地址:https://github.com/oobabooga/text-generation-webui KoboldAI-Client第四个项目是「KoboldAI-Client」,它是一个基于浏览器的前端,通过多个本地和远程 AI 模型实现 AI 辅助写作。 KoboldAI-Client 提供了一系列标准的工具,包括内存、作者注释、世界信息、保存 & 加载、可调节的 AI 设置、格式化选项以及导入现有文字冒险游戏《AI Dungeon》的能力。你可以开启 Adventure 模式,也可以玩 AI Dungeon Unleashed 之类的游戏。 该项目已在 GitHub 上获得了 1.4k 的 Stars。 项目地址:https://github.com/KoboldAI/KoboldAI-Client Open-Assistant第五个项目是「Open-Assistant」,它旨在让每一个人都可以访问基于聊天的大语言模型。项目作者希望借此在语言创新方面掀起一场革命,就像 stable diffusion 帮助世界以新的方式创造艺术和图像一样。 项目作者计划收集高质量人工生成指令执行样本(指示 + 响应),目标大于 50k。对于收集到的每个指示,他们将采样多个补全结果。接下来进入基于指示和奖励模型的 RLHF 训练阶段。 该项目已在 GitHub 上获得了 19k 的 Stars。 项目地址:https://github.com/LAION-AI/Open-Assistant stanford_alpaca第六个项目是「stanford_alpaca」,它旨在建立和共享一个指令遵循的 LLaMA 模型。该 repo 包含了用于微调模型的 52k 数据、用于生成数据的代码以及用于微调模型的代码。 该项目已在 GitHub 上获得了 9.5k 的 Stars。 项目地址:https://github.com/tatsu-lab/stanford_alpaca ChatRWKV第七个项目是「ChatRWKV」,它类似于 ChatGPT,但由 RWKV(100% RNN)模型支持,并且是开源的。项目作者表示,RWKV 是目前唯一能在质量和扩展方面媲美 transformers 的 RNN 模型,同时速度更快、节省 VRAM。 该项目已在 GitHub 上获得了 3.5k 的 Stars。 项目地址:https://github.com/BlinkDL/ChatRWKV ChatGLM-6B第八个项目是由清华技术成果转化的公司智谱 AI 开源、支持中英双语的对话语言模型「ChatGLM-6B」,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。 不过由于 ChatGLM-6B 的规模较小,目前已知其具有相当多的局限性,如事实性 / 数学逻辑错误、可能生成有害 / 有偏见内容、较弱的上下文能力、自我认知混乱、以及对英文指示生成与中文指示完全矛盾的内容。 该项目已在 GitHub 上获得了 6k 的 Stars。 项目地址:https://github.com/THUDM/ChatGLM-6B xmtf第九个项目是「xmtf」,包含了创建论文《Crosslingual Generalization through Multitask Finetuning》中介绍的 BLOOMZ、mT0 和 xP3 的所有组件。 其中 BLOOMZ 是一个 1760 亿参数且可开放获取的多语言模型;mT0(这里特指谷歌的 T5X);xP3 是 46 种语言的有监督数据集,带有英语和机器翻译的 prompts。 项目地址:https://github.com/bigscience-workshop/xmtf 除了上述提到的模型,ChatGPT 平替项目还包括基于 Meta 开源的大模型系列 (Large Language Model Meta AI)的一些研究,这个系列模型的参数量从 70 亿到 650 亿不等。具有 130 亿参数的 LLaMA 模型「在大多数基准上」可以胜过 GPT-3( 参数量达 1750 亿),而且可以在单块 V100 GPU 上运行;而最大的 650 亿参数的 LLaMA 模型可以媲美谷歌的 Chinchilla-70B 和 PaLM-540B。 论文链接:https://research.facebook.com/publications/llama-open-and-efficient-foundation-language-models/ GitHub 链接:https://github.com/facebookresearch/llama 基于此研究,开发者也提出了几个开源项目。 llama.cpp 无需 GPU,就能运行 LLaMAllama.cpp 项目实现了在 MacBook 上运行 LLaMA,还有开发者成功的在 4GB RAM 的树莓派上运行了 LLaMA 7B。总结而言,即使开发者没有 GPU ,也能运行 LLaMA 模型。 项目地址:https://github.com/ggerganov/llama.cpp ChatLLaMA由于 LLaMA 大模型系列没有使用 RLHF 方法,因此初创公司 Nebuly AI 开源了 RLHF 版 LLaMA(ChatLLaMA)的训练方法。它的训练过程类似 ChatGPT,该项目允许基于预训练的 LLaMA 模型构建 ChatGPT 形式的服务。与 ChatGPT 相比,LLaMA 架构更小,但训练过程和单 GPU 推理速度更快,成本更低;该库还支持所有的 LLaMA 模型架构(7B、13B、33B、65B),因此用户可以根据训练时间和推理性能偏好对模型进行微调。 项目地址:https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/chatllama 期待后续更多开源项目加入进来。 参考链接:https://www.reddit.com/r/MachineLearning/comments/11uk8ti/d_totally_open_alternatives_to_chatgpt/本文将为大家盘点一下 ChatGPT 的开源平替项目。
【资料图】
探寻隐私计算最新行业技术,「首届隐语开源社区开放日」报名启程
春暖花开之际,诚邀广大技术开发者&产业用户相聚活动现场,体验数智时代的隐私计算生态建设之旅,一站构建隐私计算产业体系知识:
隐私计算领域焦点之性
分布式计算系统的短板与升级策略
隐私计算跨平台互联互通
隐语开源框架金融行业实战经验
3月29日,北京·798机遇空间,隐语开源社区开放日,期待线下面基。点击阅读原文,立即报名。
©THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
标签:
推荐
- 还在为玩不了ChatGPT苦恼?这十几个开源平替也能体验智能对话
- 微头条丨2023年3月19日国内ios手游氪金榜
- 英语语音基础知识讲解_英语语音基础知识
- 如何关爱留守儿童和进城务工子女_如何关爱留守儿童
- 材料工程技术专业学什么_材料工程技术
- 速读:红绣鞋·客况_关于红绣鞋·客况介绍
- 四川下雨最多的城市_四川下雨-消息
- 单身复叶出现在什么科_单身复叶 全球快报
- 如何通过全案策略成为成功的品牌 世界新要闻
- 升旗敬礼的动作要领_敬礼的动作要领
- 每日视点!我的两爸三妈简介_我的仨妈俩爸介绍
- 当前速递!托班育儿知识大全_托班育儿知识
- 灌肠怎么炒好吃又简单图片_灌肠怎么炒好吃又简单 天天微动态
- 今日聚焦!深度|“超龄打工人”站在零工十字路口
- 树冠幅指的是什么-树冠
- 世界信息:第六届中国当代工艺美术双年展举行
- 全球实时:“男人必须站着”!女子地铁上辱骂殴打小伙,警方通报
- 最新:《青梅酸酸你微甜》大结局:口碑收视双赢,女主爱情事业双丰收
- craco配置devServer.proxy|每日视点
- 温故而知新可以为师矣的意思是什么(ldquo 温故而知新可以为师矣 rdquo 中的可以是什么意思)
- cf怎么退战队_穿越火线如何退出战队 每日短讯
- 地之咒印和天之咒印的区别_地之咒印_天天要闻
- 世界观焦点:山梨糖醇的功效与作用_硬脂酸镁的功效与作用
- 粉蒸肉的做法大全 步骤_粉蒸肉的做法详细步骤 环球精选
- WTT新加坡大满贯赛:王楚钦孙颖莎混双摘冠_焦点消息
- 直到世界终结
- 【播资讯】佛山配资开户-配资炒股配资靠不靠谱九龙证券咋开户
- 深岩银河修改器哪个好用(最新版推荐) 今日关注
- 2023武大樱花预约了可以不去吗?|天天观点
- 今热点:低压开关柜型号和含义_高压开关柜型号
- 又一起!美国再次发生“毒列车”脱轨事故
- 轻质陶粒混凝土容重是多少_陶粒混凝土容重是多少|天天微资讯
- 电暖器1周1度电?别让广告疯狂“吹牛”
- 用好网络直播 促进非遗活态传承
- 世界聚焦:素描基本功要练多久_素描基本功
- 谷歌账号后面的符号_谷歌账号@后面的是什么填入什么|今亮点
- 焦点热文:成都市特殊教育学校举办残疾人冰雪运动进校园活动
- esp是什么键_esp是什么
- 女主温柔恬静的现代小说_女主温柔恬静的宠文
- 免契税!最高每平方米补贴500元!南昌县象湖滨江购房有新政
- 去湖北抢车:狂降9万的燃油车,抄底还是抄家?_每日快播
- 反着的问号怎么打出来vivo(反着的问号怎么打)
- A股及海外市场潜在风险事件曝光
- 英国海上保险法_关于英国海上保险法的简介
- 雪中飞羽绒服12道消毒工序相当多少清洁度?
- 美国两家银行接连关闭 美记者:美联储一手制造当前经济乱象
- 绵阳南山中学双语学校直播_绵阳南山中学双语学校
- 全球最新:北京朝阳区黑庄户乡发生火情,无人员被困伤亡
- 今日手机反应太慢了怎么办怎么提速_手机反应太慢了怎么办
- 世界速看:湖南省卫健委健教中心:春季如何预防肺结核
- 海大集团:3月13日融资买入213.58万元,融资融券余额2.17亿元-视焦点讯
- 微资讯!生态凤阳添新绿
- 哪吒出世完整版_哪吒出世
- 焦点资讯:田园诗有哪些(这些你还记得吗)
- 比亚迪股份:将于3月28日举行董事会会议批准年度业绩-今日报
- 【焦点热闻】“互联网+”医疗服务能否纳入医保?国家医保局回应
- 每日快播:商贷转住房公积金贷款怎么办理?住房贷款商贷转公必须先还清才可以吗
- 世界微动态丨卫宁健康3月13日盘中涨幅达5%
- 环球快讯:明朝海禁因何而生,海患只是部分原因,关键还是思维的限制
- 藕种下多久才能看见发芽 藕种下后如何快速地发芽
- 快资讯:首都航空托运行李怎么最划算
- 3.12植树节丨爱护每一片绿 从我做起
- (两会速递)国家统计局局长:对中国经济实现5%左右增长预期目标充满信心
- 顶尖科技的结晶,骁龙5G基带“进化史”,带来更为美好连接体验
- 蜱虫有多大_蜱虫一般有多少厘米
- 杨魏玲花百度百科_杨魏玲花的真名叫什么简介介绍-观察
- 丸美护肤品怎么样?好用吗?_丸美护肤品怎么样 天天微速讯
- 王曦雨被逆转无缘IW赛32强 张帅身体不适赛中退赛 当前快播
- 蛏王肉怎么洗又快又干净_蛏王肉怎么洗干净
- 成功人士的每天的例程
- 今天最新消息 中国亚轨道运载器重复使用飞行试验取得圆满成功-看点
- low shoulder 天天动态
- 紫盖山_关于紫盖山介绍-动态焦点
- 冷气被
- 热议:婚内赠女下属百万财产 法院判“返还”
- 外师造化中得心源的意思_外师造化中得心源的意思
- 2月份北京CPI同比上涨1.2%,环比下降0.4%
- 观天下!企业扎堆落户!长宁天山路街道成为投资兴业的热土
- 郑州昨日新增阳性感染者“148+2102”,涉及风险点位公布|全球动态
- 【报资讯】国窖1573广告语_国窖1573广告语
- 世界新消息丨170是属于什么电话号_170是什么电话号码
- 环球精选!油炸鱼块的做法视频教程_油炸鱼块的做法大全
- 短讯!杀破狼到底是谁唱的_杀破狼原唱是谁
- 焦点信息:南京沿江街道:研讨促学固根基 以学促用增实效
- 每日报道:台陆委会等相关部门称10日起恢复部分两岸直航航点,国台办回应
- q9400 cpu参数带核显吗_q9400 cpu参数
- 港南区新塘镇:香瓜种植 瓜香富农-当前播报
- 全球热资讯!治疗需要多长时间_治疗要多长时间
- 【聚看点】吃完头孢6小时喝啤酒多久没事算没事_吃头孢后6小时喝啤酒了怎么办
- 每日快看:春季水果有哪些种类_水果有哪些种类
- 查工资单_查工资
- 天天观察:秉承长期主义 港股“数字货运第一股”维天运通(02482)敲锣上市
- 每日热讯!工人日报:对家暴说“不”,妇女权益保障在升级
- 红色的包子是什么做成的?_红色的包子 微头条
- 注脚线怎么删除_注脚-热消息
- 操碎了心!网友突击检查全世界大熊猫
- 妖妖小精灵_妖妖小精
- 天天动态:中来股份:钙钛矿晶硅叠层电池处于研发阶段,投入量产仍需要一定时间
- oppo小欧在哪打开 环球观焦点
- 超讯通信董秘回复:目前未考虑投资供销社-全球快播
X 关闭
行业规章
X 关闭