微软 - 智狐AI导航

Verbatik

Verbatik是一款由人工智能驱动的文本到语音生成器，提供了一个不断增长的库，包含142种语言和口音的600多种自然声音。

Ai语音工具 1970年01月01日 0 点赞 0 评论 383 浏览

Pix2Gif

Pix2Gif是一个由微软研究院开发的基于运动引导的扩散模型，能够将静态图像转换成动态的GIF动画或视频。该模型通过运动引导的扩散过程实现图像到GIF的生成，并利用文本描述和运动幅度作为输入。Pix2Gif还引入了感知损失机制，确保生成的GIF帧在视觉上与原始图像保持一致性和连贯性。

AI项目与工具 2024年01月01日 30 点赞 0 评论 685 浏览

EasyVideoTrans

EasyVideoTrans是一款开源的AI视频翻译工具，支持从视频中提取音频并翻译字幕，同时提供多样化的声音风格以实现自然的配音效果。它适用于视频创作者、教育机构、企业培训及品牌宣传等领域，能够快速生成高质量的中文版本视频，满足跨语言沟通的需求。

AI项目与工具 2025年06月12日 39 点赞 0 评论 691 浏览

Copilot Vision

Copilot Vision是一款由微软开发的人工智能辅助工具，专为Microsoft Edge浏览器设计，处于预览阶段。它能够理解网页内容，通过语音交互为用户提供实时分析和见解，帮助用户进行活动规划、购物决策和学习辅助，同时确保用户隐私安全。

AI项目与工具 2025年06月12日 79 点赞 0 评论 677 浏览

TRELLIS

TRELLIS是一款由清华大学、中国科学技术大学及微软研究院共同开发的3D生成模型，利用Structured LATent（SLAT）表示法，通过文本或图像提示生成高质量、多样化的3D资产。它融合了稀疏的3D网格结构与密集视觉特征，支持多格式输出及局部编辑，无需拟合训练即可生成细节丰富的模型。此外，TRELLIS具备两阶段生成流程，可灵活适应不同需求。

AI项目与工具 2025年06月12日 29 点赞 0 评论 434 浏览

VidTok

VidTok（Video Tokenizer）是一款由微软开发的开源视频处理工具，通过高效的算法将视频内容转化为“视频词”，支持连续与离散分词化，具有灵活的压缩率和多样的隐空间，适用于视频生成、内容建模及数据压缩等场景。其混合模型架构结合卷积与采样模块，辅以有限标量量化技术，实现了高质量视频重建与高效数据处理。

AI项目与工具 2025年06月12日 54 点赞 0 评论 875 浏览

AI Dev Gallery

AI Dev Gallery 是一款由微软开发的开源 AI 工具集，集成于 Visual Studio 中，旨在帮助开发者快速集成端侧 AI 功能。它提供超过 25 个交互式示例，涵盖文本、图像、音频和视频领域，支持从 GitHub 和 Hugging Face 下载模型，并能在本地设备上高效运行。此外，工具集还具备代码导出功能，便于开发者将示例集成至自有项目中。

AI项目与工具 2025年06月12日 55 点赞 0 评论 555 浏览

LAM

LAM是由微软开发的大型行动模型，能够理解和执行真实世界中的操作任务。它不仅能解析用户输入，还能生成具体行动指令，如启动程序或控制设备。LAM在Office等Windows应用中表现出色，任务完成率高于GPT-4。具备多模态输入理解、动态规划、环境交互和自主执行能力，适用于办公自动化、智能家居、客户服务等多个场景，显著提升任务执行效率和智能化水平。

AI项目与工具 2025年06月12日 26 点赞 0 评论 753 浏览

Copilot Search

Copilot Search 是微软 Bing 推出的智能搜索工具，融合传统搜索与生成式 AI 技术，提供简洁信息总结、来源引用、主题推荐等功能，提升信息获取效率。支持多平台使用，适用于学术研究、日常查询、工作调研及兴趣探索等多种场景，增强用户的搜索体验和信息可信度。

AI项目与工具 2025年06月12日 91 点赞 0 评论 576 浏览

NLWeb

NLWeb是微软推出的开源项目，旨在通过自然语言界面简化网站交互，使网站成为AI驱动的应用程序。它利用半结构化数据（如Schema.org、RSS）和LLM工具，提供自然语言交互、内容发现、智能体交互等功能。支持MCP协议，实现与AI助手的无缝对接，具备跨平台和高度可扩展性，适用于零售、餐饮、旅游、新闻及客服等多种场景。

AI项目与工具 2025年06月11日 50 点赞 0 评论 573 浏览

微软

首页

微软

列表

默认

浏览次数

发布日期