ChatGLM官网,清华技术,智谱AI开源的GLM系列的对话模型
ChatGLM 是智谱AI公司基于清华技术成果转化而开源的对话模型系列,支持中英两种语言。目前,该系列开源了规模为62亿参数的模型。这些模型在继承了GLM的优势基础上进行了架构优化,降低了部署和应用的门槛,使得大型模型可以在消费级显卡上进行推理应用。
ChatGLM官网: https://chatglm.cn/
github项目网址: (安装和使用教程请看官方介绍)
https://github.com/THUDM/ChatGLM-6B
从技术路线的角度来看,ChatGLM 实现了强化学习人类对齐策略,使得生成的对话效果更加贴近人类的价值观。目前,它的能力领域主要包括自我认知、提纲写作、文案写作、邮件写作助手、信息抽取、角色扮演、评论比较、旅游建议等。此外,ChatGLM 还开发了一个正在内测的超大模型,参数规模达到了1300亿,这在当前的开源对话模型中属于较大规模。
ChatGLM 的开源为研究人员和开发者提供了一个强大的工具,可以用于各种对话场景和应用。它的性能和规模使得它成为处理复杂对话任务和生成高质量对话的理想选择。随着ChatGLM的不断发展和改进,我们可以期待更多创新和应用在对话系统领域的实现。
ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答,更多信息请参考我们的博客。
为了方便下游开发者针对自己的应用场景定制模型,我们同时实现了基于 P-Tuning v2 的高效参数微调方法 (使用指南) ,INT4 量化级别下最低只需 7GB 显存即可启动微调。
想让 ChatGLM-6B 更符合你的应用场景?欢迎参与 Badcase 反馈计划。
ChatGLM-6B 开源模型旨在与开源社区一起推动大模型技术发展,恳请开发者和大家遵守开源协议,勿将开源模型和代码及基于开源项目产生的衍生物用于任何可能给国家和社会带来危害的用途以及用于任何未经过安全评估和备案的服务。目前,本项目团队未基于 ChatGLM-6B 开发任何应用,包括网页端、安卓、苹果 iOS 及 Windows App 等应用。
尽管模型在训练的各个阶段都尽力确保数据的合规性和准确性,但由于 ChatGLM-6B 模型规模较小,且模型受概率随机性因素影响,无法保证输出内容的准确性,且模型易被误导(详见局限性)。本项目不承担开源模型和代码导致的数据安全、舆情风险或发生任何模型被误导、滥用、传播、不当利用而产生的风险和责任。
使用 pip 安装依赖:pip install -r requirements.txt,其中 transformers 库版本推荐为 4.27.1,但理论上不低于 4.23.1 即可。
此外,如果需要在 cpu 上运行量化后的模型,还需要安装 gcc 与 openmp。多数 Linux 发行版默认已安装。对于 Windows ,可在安装 TDM-GCC 时勾选 openmp。 Windows 测试环境 gcc 版本为 TDM-GCC 10.3.0, Linux 为 gcc 11.3.0。在 MacOS 上请参考 Q1。
可以通过如下代码调用 ChatGLM-6B 模型来生成对话:
>>> from transformers import AutoTokenizer, AutoModel>>> tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True)>>> model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()>>> model = model.eval()>>> response, history = model.chat(tokenizer, "你好", history=[])>>> print(response)你好智谱ai,新一代认知智能大模型,最具OpenAI气质和水准”的 AI 公司,基于领先的千亿级多语言、多模态预训练模型,打造高效率、通用化的“模型即服务”AI开发新范式
APACHE MXNET灵活高效深度学习库,开源深度学习框架
sklearn,Scikit-learn针对Python编程语言的免费软件机器学习库
Lamini,让你低代码快速调教出一个属于自己的大语言模型
BLOOM,HuggingFace推出的大型语言模型(LLM)
阿里巴巴M6,阿里达摩院推出的超大规模中文预训练模型
DeepSpeed,微软开发的开源深度学习优化库,大规模模型分布式训练的工具
Agent-S,Simular AI 开发的开源代理框架,通过图形用户界面(GUI)实现人机交互的自动化
可以免费使用gemini3 ,claude4.5 GPT5.1等!! flowith,flowith邀请码,画布式的AI工作流,全球首个无限执行智能体
Kimi Claw,月之暗面推出的云端原生AI代理服务
百度文心大模型官网,ai作画网站,写作,ai绘画,论文,文生图,写歌
Qwen2,通义千问开源超闭源!Qwen2发布即爆火
Watsonx.ai,IBM旗下企业级生成式人工智能和机器学习平台
mule run,专注于AI智能体的市场平台,提供即插即用AI工具
Muset官网,基于AI、具备上下文感知能力的工作空间
一站式AI应用平台,,内容创作、文案、问答、图像生成、视频生成、语音生成、智能 Agent、自动化工作流、自定义 AI 应用,定制你专属的 AI 应用工作台