Toggle navigation
首页
AI产品列表
AI工具箱
Ai科技公司
Ai提示指令
GPTs应用
Ai学习资源
Ai开源项目
Ai平台模型
Ai编程建站
Ai办公效率
AI搜索问答
Ai图片处理
资源素材
网盘传输
插画网站
logo图标
摄影壁纸
影视资源
剧本文案
字体字库
音乐素材
视频素材
免商图片
创作工具
调色配色
直播录屏
字幕配音
格式转换
排版编辑
思维导图
视频剪辑
图片处理
媒体运营
媒体资讯
裂变增长
流量采买
流量变现
数据分析
红人营销
媒体平台
实时热榜
知识付费
行业圈子
AI服务商
3D&游戏
创业营销
生活创意
招聘求职
教育学习
财经投资
电商运营
独立开发
新闻中心
AI项目与工具
专题
🐱开挂猫数字人
登录
注册
AI工具箱
Ai科技公司
Ai提示指令
GPTs应用
Ai学习资源
Ai开源项目
Ai平台模型
Ai编程建站
Ai办公效率
AI搜索问答
Ai图片处理
Ai语音工具
Ai视频生成
Ai绘画生成
Ai写作对话
资源素材
网盘传输
插画网站
logo图标
摄影壁纸
影视资源
剧本文案
字体字库
音乐素材
视频素材
免商图片
PPT资源
创作工具
调色配色
直播录屏
字幕配音
格式转换
排版编辑
思维导图
视频剪辑
图片处理
媒体运营
媒体资讯
裂变增长
流量采买
流量变现
数据分析
红人营销
媒体平台
实时热榜
知识付费
行业圈子
AI服务商
3D&游戏
创业营销
生活创意
招聘求职
教育学习
财经投资
电商运营
独立开发
admin
这家伙很懒,什么也没写
文章
6652
评论
3
加入时间
8年前
TA的文章
AtomoVideo
AtomoVideo是一款高保真图像到视频生成框架,能够从静态图像生成高质量视频内容。它通过多粒度图像注入和高质量数据集及训练策略,保证生成视频与原始图像的高度一致性和良好的时间连贯性。此外,AtomoVideo还支持长视频生成、文本到视频生成以及个性化和可控生成等功能。
190
0
Moondream
Moondream是一款小型的开源人工智能视觉语言模型,具有强大的图像处理能力和灵活性,能够在不同设备上运行。它基于Apache 2.0许可证,支持商业使用,并广泛应用于安全监控、无人机和机器人技术以及零售与购物领域。
495
0
PixArt
PixArt-Σ是一款基于扩散Transformer架构(DiT)的文本生成图像模型,专为生成高达4K分辨率的高质量图像而设计。该模型通过整合高级元素并采用从弱到强的训练方法,不仅提升了生成图像的保真度,还增强了图像与文本提示之间的对齐效果。PixArt-Σ的生成图像在美学质量上可媲美当前顶级的文本到图像产品,并且在遵循文本提示方面表现出色。主要功能包括4K分辨率图像生成、高保真转换、高效率训练和
499
0
ELLA
ELLA(Efficient Large Language Model Adapter)是一种由腾讯研究人员开发的方法,旨在提升文本到图像生成模型的语义对齐能力。它通过引入时序感知语义连接器(TSC),动态提取预训练大型语言模型(LLM)中的时序依赖条件,从而提高模型对复杂文本提示的理解能力。ELLA无需重新训练,可以直接应用于预训练的LLM和U-Net模型,且能与现有模型和工具无缝集成,显著提升
175
0
Transformer Debugger
Transformer Debugger (TDB) 是一款由OpenAI的对齐团队开发的工具,用于帮助研究人员和开发者理解和分析Transformer模型的内部结构和行为。它提供了无需编程即可探索模型结构的能力,并具备前向传递干预、组件级分析、自动生成解释、可视化界面及后端支持等功能。TDB 支持多种模型和数据集,包括GPT-2模型及其自动编码器。
217
0
Pix2Gif
Pix2Gif是一个由微软研究院开发的基于运动引导的扩散模型,能够将静态图像转换成动态的GIF动画或视频。该模型通过运动引导的扩散过程实现图像到GIF的生成,并利用文本描述和运动幅度作为输入。Pix2Gif还引入了感知损失机制,确保生成的GIF帧在视觉上与原始图像保持一致性和连贯性。
398
0
Comflowy
Comflowy 是一个专注于将 ComfyUI 工作流转化为实用工具的平台,提供超过 100 个预安装的扩展,支持多种主流 AI 模型,包括一些闭源模型。它具备强大的云 GPU 支持,用户友好的界面设计以及灵活的节点系统,帮助用户高效管理和生成高质量的工作流,适用于多种应用场景,如室内设计、快速手绘生成、艺术风格转换及视频生成等。
393
0
Follow
Follow-Your-Click是一款由腾讯、清华大学和香港科技大学合作开发的图像到视频生成模型。它允许用户通过简单的点击和动作提示将静态图像转化为包含局部动画效果的动态视频。主要功能包括直观的用户界面、局部动画生成、多对象处理、简短动作提示、高质量视频生成及运动速度控制。其工作原理涉及用户交互、图像分割、第一帧遮罩策略、运动增强模块和基于光流的运动幅度控制。
490
0
AutoDev
AutoDev是一款由微软研发的AI编程辅助工具,专注于自动化软件工程任务,如代码编写、调试、测试和版本控制等。它通过目标定义与任务分配、代码生成、测试执行、代码维护、文件编辑、信息检索、构建与执行、多智能体协作、对话管理和安全隐私保护等功能,提高软件开发效率和质量。AutoDev的架构设计确保了其高效、安全和可控性,支持在无干预情况下自主完成任务。
351
0
Grok
Grok-1是由xAI公司开发的大型语言模型,具备3140亿参数,是目前参数量最大的开源大语言模型之一。该模型基于Transformer架构,专用于自然语言处理任务,如问答、信息检索、创意写作和编码辅助等。尽管在信息处理方面表现出色,但需要人工审核以确保准确性。此外,Grok-1还提供了8bit量化版本,以降低存储和计算需求。
291
0
«
1
2
3
4
5
6
7
8
...
665
666
»
用户菜单
TA的文章
TA的评论
微信公众账号
微信扫一扫加关注
返回
顶部