Toggle navigation
首页
AI产品列表
AI工具箱
AI云算力平台
Ai科技公司
Ai提示指令
GPTs应用
Ai学习资源
Ai开源项目
Ai平台模型
Ai编程建站
Ai办公效率
AI搜索问答
Ai图片处理
Ai语音工具
Ai视频生成
Ai绘画生成
AI写作对话
资源素材
网盘传输
插画网站
logo图标
摄影壁纸
影视资源
剧本文案
字体字库
音乐素材
视频素材
免商图片
PPT资源
创作工具
调色配色
直播录屏
字幕配音
格式转换
排版编辑
思维导图
视频剪辑
图片处理
媒体运营
媒体资讯
裂变增长
流量采买
流量变现
数据分析
红人营销
媒体平台
实时热榜
知识付费
行业圈子
AI服务商
3D&游戏
创业营销
生活创意
招聘求职
教育学习
财经投资
电商运营
独立开发
旗下应用
河马销售导师
海豚面试助手
🐱开挂猫数字人
AI项目与工具
新闻中心
专题
Agent专区
服务部署
数字人对话
AI虚拟试衣
图片转3D模型
照片表情修改
图像修复
AI换脸
大模型
文生图
视频生成
语音合成
实时变声
声音克隆
数字人合成
语音识别
登录
注册
AI工具箱
AI云算力平台
Ai科技公司
Ai提示指令
GPTs应用
Ai学习资源
Ai开源项目
Ai平台模型
Ai编程建站
Ai办公效率
AI搜索问答
Ai图片处理
Ai语音工具
Ai视频生成
Ai绘画生成
AI写作对话
资源素材
网盘传输
插画网站
logo图标
摄影壁纸
影视资源
剧本文案
字体字库
音乐素材
视频素材
免商图片
PPT资源
创作工具
调色配色
直播录屏
字幕配音
格式转换
排版编辑
思维导图
视频剪辑
图片处理
媒体运营
媒体资讯
裂变增长
流量采买
流量变现
数据分析
红人营销
媒体平台
实时热榜
知识付费
行业圈子
AI服务商
3D&游戏
创业营销
生活创意
招聘求职
教育学习
财经投资
电商运营
独立开发
admin
这家伙很懒,什么也没写
文章
6649
评论
3
加入时间
8年前
TA的文章
IFAdapter
IFAdapter是一种由腾讯与新加坡国立大学联合开发的文本到图像生成模型,专为提高多实例图像生成时的空间定位与特征表达准确性而设计。它通过“外观标记”与“实例语义图”两大关键技术解决了传统方法中的定位与特征问题,并支持以即插即用的形式融入现有扩散模型,无需重新训练即可实现高效的空间控制。
458
0
TinyVLA
TinyVLA是一种轻量级的视觉-语言-动作(VLA)模型,专为机器人操控设计。它通过结合多模态模型和扩散策略解码器,实现了快速推理、数据高效和多任务学习的能力,并在泛化性能上表现优异。TinyVLA可应用于家庭、工业、服务等多个领域,具有广泛的实用价值。
431
0
Inverse Painting
Inverse Painting 是一种基于 AI 的创新技术,能够逆向还原绘画过程,通过分析艺术家的绘画视频学习技巧与顺序,生成详细的绘画指令,逐步更新画布,模拟创作流程。该工具可应用于艺术教育、艺术创作辅助、文化遗产保护、艺术品鉴定、娱乐产业及交互式媒体等多个领域。
498
0
Playground v3
Playground v3是一款基于大型语言模型(LLM)的文本到图像生成工具,具备240亿参数量的潜扩散架构(LDM),能够精准理解和生成复杂的图像内容,支持RGB颜色控制和多语言文本生成。其核心功能包括文本到图像生成、图形设计、RGB颜色控制和多语言支持,广泛应用于设计、内容创作、游戏开发、广告等多个领域。
495
0
Transkriptor
Transkriptor是一款基于AI技术的在线音频和视频转录工具,支持100多种语言,兼容多种文件格式。它提供包括转录、翻译、编辑、多格式导出及AI聊天助手在内的全面功能,旨在满足用户对语音数据处理的需求。其应用场景广泛,如会议记录、教育、法律记录等,可大幅提升工作效率和准确性。
385
0
Reverb ASR
Reverb ASR是一款基于深度学习的开源自动语音识别与说话人分离工具,采用20万小时高质量英语语音数据训练,具备高精度语音转录能力,支持逐字稿控制及多种解码模式。其显著特点是擅长处理长时间语音内容,并在长篇幅识别任务中超越其他开源模型。Reverb ASR适用于播客、会议记录、法庭记录等多个应用场景,为用户提供灵活且高效的语音转文字解决方案。
395
0
Pixcap
Pixcap 是一款基于AI技术的3D设计工具,允许用户通过选择和混合10,000多个3D元素,快速生成个性化设计。平台提供强大的AI生成功能、动画制作能力以及广泛的文件格式兼容性,适用于网页设计、动画制作、品牌推广等多个领域,助力提升视觉效果与用户体验。 ---
228
0
Open NotebookLM
Open NotebookLM是一个开源工具,能够将PDF文档转换为播客形式的音频内容。它基于Llama 3.1 405B、MeloTTS和Bark等先进AI模型,生成自然流畅的对话式音频,并支持多语言及个性化音调设置。用户可通过简单易用的Gradio界面上传PDF文件并下载MP3格式的音频文件,适用于教育、科研、商业分析等多个领域。
478
0
Framedrop
Framedrop是一款基于AI技术的在线工具,专注于从长视频中提取精彩片段并转化为短视频。它支持多平台视频导入,具备自动高光检测、智能剪辑、多语言字幕生成等功能,适合游戏直播、播客、教育等多种内容类型,帮助创作者提高效率并增强社交媒体传播力。
343
0
StoryDiffusion
StoryDiffusion 是一种基于 AI 的图像和视频生成框架,通过 Consistent Self-Attention 和 Semantic Motion Predictor 技术,实现从文本到连贯图像和视频的转化,支持用户高效生成高质量视觉内容,广泛应用于动漫、教育、广告及影视等领域。
277
0
«
1
2
...
55
56
57
58
59
60
61
...
664
665
»
用户菜单
TA的文章
TA的评论
微信公众账号
微信扫一扫加关注
返回
顶部