学习 - 智狐AI导航

Veo

Veo是Google DeepMind开发的一款视频生成模型，用户可以通过文本、图像或视频提示来指导其生成所需的视频内容。Veo具备深入的自然语言理解能力，能够准确解析用户的文本提示，生成高质量、高分辨率的视频。其主要功能包括高分辨率视频输出、自然语言处理、风格适应性、创意控制与定制、遮罩编辑功能、参考图像与风格应用、视频片段的剪辑与扩展以及视觉连贯性。Veo技术目前仍处于实验阶段，但已在电影制作

AI项目与工具 2024年01月01日 34 点赞 0 评论 516 浏览

AutoConsis

AutoConsis是一款基于深度学习和大型语言模型的UI内容一致性智能检测工具，能够自动识别和提取界面中的关键数据，并对数据一致性进行高效校验。它支持多业务场景适配，具备高泛化性和高置信度，广泛应用于电商、金融、旅游等多个领域，助力提升用户体验和系统可靠性。

AI项目与工具 2025年06月12日 10 点赞 0 评论 517 浏览

PSHuman

PSHuman是一款基于跨尺度多视图扩散模型的单图像3D人像重建工具，仅需一张照片即可生成高保真度的3D人体模型，支持全身姿态和面部细节的精确重建。其核心技术包括多视角生成、SMPL-X人体模型融合及显式雕刻技术，确保模型在几何和纹理上的真实感。该工具适用于影视、游戏、VR/AR、时尚设计等多个领域，具备高效、精准和易用的特点。

AI项目与工具 2025年06月12日 49 点赞 0 评论 517 浏览

CapsWriter

CapsWriter-Offline是一款基于PC端的离线语音输入与字幕转录工具，支持实时语音转文字功能，具备高准确率和无限时长录音能力。其核心技术依托于深度学习模型，可处理中英文混合语音，并提供热词自定义功能以提升特定术语的识别效果。此工具适用于会议记录、学术讲座、视频字幕生成等多种场景，同时确保用户数据的安全与隐私。 ---

AI项目与工具 2025年06月12日 38 点赞 0 评论 518 浏览

Kimi学术搜索

Kimi学术搜索是一款基于人工智能技术的学术研究辅助工具，通过深度推理、信息整合及实时交互等功能，帮助用户高效地获取学术资源。其主要特点包括多语言支持、自我评估改进机制以及对复杂任务的精准响应能力，广泛应用于学术研究、市场分析、学习辅导和技术支持等领域。

AI项目与工具 2025年06月12日 37 点赞 0 评论 518 浏览

Titans

Titans是谷歌推出的新型神经网络架构，突破了传统Transformer在处理长序列数据时的限制。其核心是神经长期记忆模块，可模拟人脑记忆机制，提升对关键信息的存储与提取能力。Titans支持多种任务，包括语言建模、常识推理和时间序列预测，尤其在处理超长上下文时表现优异。该架构具备并行计算能力，提高了训练效率，适用于文本生成、生物信息学、视频音乐处理等多个领域。

AI项目与工具 2025年06月12日 27 点赞 0 评论 518 浏览

ReCamMaster

ReCamMaster 是由浙江大学与快手科技联合开发的视频重渲染框架，支持根据用户指定的相机轨迹生成新视角视频。采用预训练模型与帧维度条件机制，实现视频视角、运动轨迹的灵活调整。具备视频稳定化、超分辨率、外扩等功能，适用于视频创作、后期制作、自动驾驶和虚拟现实等领域，提升视频内容的表现力与质量。

AI项目与工具 2025年06月12日 95 点赞 0 评论 518 浏览

Torch

Torch-MLU 是一个开源的 PyTorch 扩展插件，支持开发者将寒武纪 MLU 系列智能加速卡作为 PyTorch 的加速后端。它实现了对 PyTorch 的原生支持，使开发者能够无缝地将基于 GPU 的深度学习模型迁移到 MLU 硬件上，显著提高模型的训练和推理效率。此外，Torch-MLU 还支持自动混合精度训练，通过优化计算图等技术，进一步提升了模型的执行效率。

AI项目与工具 2025年06月12日 13 点赞 0 评论 519 浏览

PaintsUndo

PaintsUndo是一款AI驱动的绘画过程生成工具，适合数字艺术创作者和绘画爱好者。用户只需提供一张静态图像，PaintsUndo便能自动生成该图像的绘画全过

Ai绘画生成 2025年06月05日 48 点赞 0 评论 519 浏览

必剪Studio

哔哩哔哩发布的国内首个免费数字分身定制工具。必剪Studio集成了一站式的“数字分身”及“音色定制”功能，帮助出镜创作者和录音创作者有效提升创作效率。

视频剪辑 2025年06月05日 87 点赞 0 评论 519 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期

Veo