Imagen官网,Google Brain推出的文本生成图像扩散模型
Imagen AI 是一种文本到图像的扩散模型,由 Google Research Brain Team 于 2022 年开发。它具有前所未有的逼真度和深层次的语言理解能力。Google Imagen AI建立在大型 Transformer 语言模型理解文本的能力之上,并具有扩散模型在高保真图像生成方面的优势。简而言之,Imagen 是一个人工智能系统,可以根据输入文本创建逼真的图像。
Imagen官网: https://imagen.research.google
谷歌的Imagen AI系统是一种可以将自然文本转换为图像的先进模型,类似于OpenAI的DALL-E 2。然而,谷歌目前还未向公众开放完整版本的文本到图像AI模型。不过,现在情况正在发生变化,至少有一些变化。谷歌宣布将在其AI Test Kitchen应用程序中添加一个不完全版的Imagen。
AI Test Kitchen是在今年早些时候发布的,它开放了谷歌部分AI技术的测试版。谷歌将在该应用程序中添加Imagen,但会有一些限制。用户可以通过两种方式与Imagen进行互动,称为”城市梦想家”和”摇摆”。
在”城市梦想家”中,用户可以创造一个城市,并选择他们想要的主题。例如,如果你想创建一个”赛博城市”,Imagen的”城市梦想家”将围绕”赛博”主题创建建筑模型。这些设计看起来类似于等距模型,就像The Verge指出的那样,”看起来有点像你在模拟城市游戏中看到的样子”。
关于”摇摆”功能,它可以让用户创建一个小怪物。用户可以选择怪物的材质,如粘土、毛毡或橡胶,并给它穿上自己选择的衣服。Imagen将根据用户的描述创建出相应的怪物,用户可以为它命名并与之互动。这个功能有一些限制,用户无法创建任何想要的怪物,但是”摇摆”中的所有怪物都将共享一些设计语言。与DALL-E的公开测试版一样,Imagen的互动自由度也是有限的。
谷歌并没有详细说明这些限制是软件自身的特性,但这些限制对于Imagen的后续调试非常重要。AI Test Kitchen的目的是获得用户反馈,帮助谷歌发现AI技术方面的问题,用户与系统的互动也是测试的一部分。
随着人工智能技术变得越来越复杂和普及,相关的风险也越来越大。当限制和自由度完全开放时,一小部分用户可能会滥用这项技术。对于像谷歌这样的公司来说,用户滥用其产品可能会带来严重后果,甚至在极端情况下对其他用户或谷歌本身造成严重损害。
毫无疑问,Imagen是最先进的人工智能模型之一。然而,能力越大,责任也越大。目前还不清楚Imagen将何时成为完全公开的商业产品,如果会成为商业产品。不过,用户目前可以通过”城市梦想家”和”摇摆”功能进行测试体验。AI Test Kitchen可在Android和iOS平台上免费下载使用。
智谱ai,新一代认知智能大模型,最具OpenAI气质和水准”的 AI 公司,基于领先的千亿级多语言、多模态预训练模型,打造高效率、通用化的“模型即服务”AI开发新范式
APACHE MXNET灵活高效深度学习库,开源深度学习框架
sklearn,Scikit-learn针对Python编程语言的免费软件机器学习库
Lamini,让你低代码快速调教出一个属于自己的大语言模型
BLOOM,HuggingFace推出的大型语言模型(LLM)
阿里巴巴M6,阿里达摩院推出的超大规模中文预训练模型
ToDesk远程控制软件是一款稳定流畅的远程控制电脑手机连接软件,可远程桌面办公,远程协助运维,采用端对端加密,让每一次远程访问都安全可靠。
minimax agent,AI写作,语音交互,图像识别,文档分析,代码生成,实时翻译等多种功能
百度文心大模型官网,ai作画网站,写作,ai绘画,论文,文生图,写歌
蓝心大模型,vivolm,vivo自研的通用大模型
runway gen2,Runway最新推出的AI文字转视频生成模型
WorkBuddy 是腾讯云代码助手推出的 AI Agent 办公工具,自主规划并交付多模态复杂任务结果,支持多 Agents 并行工作,极致提效。
天工AI助手,对标ChatGPT的大语言模型
DeepSpeed,微软开发的开源深度学习优化库,大规模模型分布式训练的工具
Agent-S,Simular AI 开发的开源代理框架,通过图形用户界面(GUI)实现人机交互的自动化
Muset官网,基于AI、具备上下文感知能力的工作空间