Toggle navigation
首页
AI产品列表
AI工具箱
AI云算力平台
Ai科技公司
Ai提示指令
GPTs应用
Ai学习资源
Ai开源项目
Ai平台模型
Ai编程建站
Ai办公效率
AI搜索问答
Ai图片处理
Ai语音工具
Ai视频生成
Ai绘画生成
AI写作对话
资源素材
网盘传输
插画网站
logo图标
摄影壁纸
影视资源
剧本文案
字体字库
音乐素材
视频素材
免商图片
PPT资源
创作工具
调色配色
直播录屏
字幕配音
格式转换
排版编辑
思维导图
视频剪辑
图片处理
媒体运营
媒体资讯
裂变增长
流量采买
流量变现
数据分析
红人营销
媒体平台
实时热榜
知识付费
行业圈子
AI服务商
3D&游戏
创业营销
生活创意
招聘求职
教育学习
财经投资
电商运营
独立开发
旗下应用
河马销售导师
海豚面试助手
🐱开挂猫数字人
AI项目与工具
专题
智狐AI工具箱
服务部署
数字人对话
AI虚拟试衣
图片转3D模型
照片表情修改
图像修复
AI换脸
大模型
文生图
视频生成
语音合成
实时变声
声音克隆
数字人合成
语音识别
登录
注册
AI工具箱
AI云算力平台
Ai科技公司
Ai提示指令
GPTs应用
Ai学习资源
Ai开源项目
Ai平台模型
Ai编程建站
Ai办公效率
AI搜索问答
Ai图片处理
Ai语音工具
Ai视频生成
Ai绘画生成
AI写作对话
资源素材
网盘传输
插画网站
logo图标
摄影壁纸
影视资源
剧本文案
字体字库
音乐素材
视频素材
免商图片
PPT资源
创作工具
调色配色
直播录屏
字幕配音
格式转换
排版编辑
思维导图
视频剪辑
图片处理
媒体运营
媒体资讯
裂变增长
流量采买
流量变现
数据分析
红人营销
媒体平台
实时热榜
知识付费
行业圈子
AI服务商
3D&游戏
创业营销
生活创意
招聘求职
教育学习
财经投资
电商运营
独立开发
admin
这家伙很懒,什么也没写
文章
6649
评论
3
加入时间
8年前
TA的文章
PaddleSpeech
PaddleSpeech是百度飞桨团队开发的开源语音处理工具,涵盖语音识别、语音合成、声纹识别、语音翻译等功能。支持多种接口形式,适用于智能语音助手、语音播报、身份验证等场景。基于PaddlePaddle框架,提供高效的深度学习模型和丰富的音频处理能力,适用于多种实际应用需求。
219
0
ChatAnyone
ChatAnyone是阿里巴巴通义实验室开发的实时风格化肖像视频生成工具,基于音频输入生成高保真、自然流畅的上半身动态视频。采用分层运动扩散模型和混合控制融合生成模型,支持实时交互与风格化控制,适用于虚拟主播、视频会议、内容创作等多种场景,具备高度可扩展性和实用性。
252
0
Math24o
Math24o 是 SuperCLUE 开源的高中奥林匹克数学竞赛级别数学推理测评基准,基于 2024 年全国高中数学竞赛预赛试题,包含 21 道高难度解答题。评测通过程序自动判断答案一致性,客观评估模型正确率。支持自动化评估流程,适用于教育、学术研究和模型优化等领域,为数学推理能力的提升提供重要工具。
150
0
RoboBrain
RoboBrain是由智源研究院开发的开源具身大脑模型,支持任务规划、可操作区域感知和轨迹预测等功能。其基于LLaVA框架,采用多阶段训练策略,具备高分辨率图像处理和长历史帧记忆能力。适用于多机器人协作、复杂任务执行及实时优化场景,依托ShareRobot数据集提升模型性能,广泛应用于机器人操作领域。
262
0
RoboOS
RoboOS是智源研究院推出的跨本体具身大小脑协作框架,采用“大脑-小脑”分层架构,支持多类型机器人协同作业。具身大脑负责全局感知与决策,小脑技能库实现精准执行,跨机器人数据中枢确保信息共享与状态同步。系统具备即插即用、端云一体化、低延迟响应等优势,广泛应用于工业、物流、制造和服务机器人等领域。
388
0
Vidu Q1
Vidu Q1是清华大学朱军教授团队研发的高可控视频生成模型,支持1080p高清视频生成,具备精准音效控制、多主体一致性调节、局部超分重建等功能。在多项国际评测中表现优异,包括VBench和SuperCLUE榜单均获第一。模型基于扩散模型与U-ViT架构,融合文本、图像和视频信息,适用于影视制作、广告宣传及动画创作等领域。
244
0
ObjectMover
ObjectMover是由香港大学与Adobe Research联合开发的图像编辑模型,专注于解决物体移动、插入和移除过程中的光影协调问题。通过视频先验迁移和序列到序列建模技术,实现对光照、阴影和遮挡关系的精准控制。支持多任务学习,提升模型在真实场景中的适应性。广泛应用于特效制作、虚拟场景编辑、游戏开发等领域,具备高效、真实的图像编辑能力。
152
0
PhysGen3D
PhysGen3D 是一款能够将单张图像转换为交互式 3D 场景并生成物理真实视频的工具。它结合图像分析与物理模拟技术,支持精确控制物体属性、动态效果整合及高质量渲染。适用于影视、VR/AR、教育、游戏和广告等多个领域,提供高效且逼真的视觉内容生成能力。
146
0
EmotiVoice
EmotiVoice是网易有道推出的开源文本到语音系统,支持中英文及2000+音色,能根据提示生成带情感的语音。具备情感合成、语音克隆、多语言支持等功能,提供Web界面和API接口,适用于有声读物、智能助手、教育、客服等场景,技术上支持高效部署与模型微调。
350
0
Vibe Draw
Vibe Draw是一款开源AI 3D建模工具,能将2D草图自动转换为高质量3D模型,并支持文本提示优化和模型编辑。用户可一键导出为glTF格式,适用于创意设计、教育、游戏开发等多个领域。工具基于Next.js、React、Three.js、FastAPI等技术,具备高效的实时交互与异步处理能力。
205
0
«
1
2
...
278
279
280
281
282
283
284
...
664
665
»
用户菜单
TA的文章
TA的评论
微信公众账号
微信扫一扫加关注
返回
顶部