学习 - 智狐AI导航

TripoSF

TripoSF是由VAST推出的新型3D基础模型，采用SparseFlex表示方法和稀疏体素结构，显著降低内存占用并提升高分辨率建模能力。其“视锥体感知的分区体素训练”策略优化了训练效率，使模型在细节捕捉、拓扑结构支持和实时渲染方面表现突出。实验数据显示，TripoSF在Chamfer Distance和F-score等关键指标上分别降低82%和提升88%。适用于视觉特效、游戏开发、具身智能及产品

AI项目与工具 2025年06月12日 71 点赞 0 评论 788 浏览

MineWorld

MineWorld是由微软研究院开发的基于《我的世界》的实时交互式AI模型，采用视觉-动作自回归Transformer架构，实现高保真、可控性强的场景生成。通过并行解码算法，模型可在每秒4至7帧的速度下实现实时交互，适用于具身智能、强化学习、游戏代理及视频生成等场景。其核心技术包括图像与动作标记器、Transformer解码器以及优化的训练与推理流程。

AI项目与工具 2025年06月11日 93 点赞 0 评论 788 浏览

花魁小站

花魁小站是一个开放性的CG游戏美术交流社区，免费分享CG行业资讯，资源，学习为一体的CG美术类平台.

影视资源 2025年06月05日 18 点赞 0 评论 789 浏览

Topaz Video AI 4

一家为专业人士提供基于人工智能的照片和视频增强软件的公司。他们的软件利用深度学习来提高图像质量，包括降噪、锐化、提升分辨率等功能。

Ai视频生成 2025年06月05日 49 点赞 0 评论 789 浏览

Voicemaker

Voicemaker，强大的文本到语音转换器，它也能通过先进的人工智能技术来制作高质量的画外音，听起来像人性化且富有表现力。

Ai语音工具 2025年06月05日 44 点赞 0 评论 789 浏览

TIGER

TIGER是由清华大学研发的轻量级语音分离模型，采用时频交叉建模策略与多尺度注意力机制，有效提升语音分离性能，同时显著降低计算和参数开销。模型通过频带切分优化资源利用，适应复杂声学环境，广泛应用于会议记录、视频剪辑、电影音频处理及智能语音助手等领域。

AI项目与工具 2025年06月12日 98 点赞 0 评论 789 浏览

MemFree

MemFree是一款开源的混合AI搜索引擎，集成了多种AI技术和搜索引擎功能，支持文本、图像、文件和网页等多种输入形式，可提供文本、思维导图、图片和视频等多格式搜索结果。其核心功能涵盖图像处理、文档总结与提问、学术问题解答、代码解释与生成等，特别适用于学术研究、工作办公和日常生活场景，旨在优化知识管理、提升生产力并降低使用成本。

AI项目与工具 2025年06月12日 42 点赞 0 评论 790 浏览

LearnCoach

LearnCoach 是一款面向 K12 学生的 AI 学习平台，提供个性化课程、智能辅导和多种学习模式，如辅导课程与视频播放列表。平台包含丰富的视频教程和考试题库，帮助学生掌握重点知识，提升学习效率。支持语音输入与全天候访问，适用于日常学习、考前复习及课堂教学辅助，助力学生高效学习与成绩提升。

AI项目与工具 2025年06月12日 53 点赞 0 评论 790 浏览

GPT-SoVITS

一个强大的语音合成工具，特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换，支持多种语言，并提供了易于使用的WebUI工具。

Ai平台模型 1970年01月01日 0 点赞 0 评论 792 浏览

Etna模型

一个文字转视频的AIGC模型，Etna能够根据简短的文本描述生成相应的视频内容，支持生成时长为8-15秒的视频，且视频流畅度极高，每秒可达60帧。

Ai视频生成 2025年06月05日 28 点赞 0 评论 792 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期