AI项目与工具

AsrTools

AsrTools是一款无需复杂配置的智能语音转文字工具,支持多种音频格式的转换,生成SRT和TXT字幕文件,适用于视频字幕、会议记录、音频转写等多个场景。它具有友好的用户界面、高效的多线程处理能力以及详细的技术文档,旨在为用户提供便捷、准确的语音转文字解决方案。

Figma

Figma-Low-Code 是一款基于 Luisa 框架的开源工具,通过将 Figma 设计自动转换为 Vue.js 应用程序,大幅缩短设计与开发间的交接时间。支持零代码渲染、数据绑定、自定义组件扩展及响应式布局,有效分离 UI 和业务逻辑,提升团队协作效率。适用于快速原型制作、敏捷开发、MVP 开发以及教育场景。

CineMaster

CineMaster是快手推出的3D感知视频生成框架,支持通过文本提示及深度图、相机轨迹等控制信号生成高质量视频内容。其核心功能包括3D物体与摄像机控制、交互式设计、自动化数据标注和高质量视频输出。采用两阶段工作流程与扩散模型技术,结合语义布局控制网络与摄像机适配器,提升视频生成的精确度与灵活性。适用于影视制作、广告营销、游戏开发等多个领域。

AgenticSeek

AgenticSeek是一款完全本地化的开源AI助手,作为Manus的开源替代品,它能够在本地设备上自主执行任务,如浏览网页、编写代码和规划项目,确保用户隐私。支持多种编程语言,具备智能任务拆解与执行能力,用户可通过语音或文本交互。适用于注重隐私和希望在本地环境中使用AI工具的用户。

QuickVid

QuickVid是一款利用AI技术的视频编辑工具,可将长视频自动剪辑为适配社交媒体的短视频片段。其核心功能包括一键剪辑、AI驱动的精彩瞬间识别、自动化字幕生成、病毒式传播潜力评估及智能布局调整。适用于社交媒体内容创作、品牌营销、教育培训等多个领域,显著提升视频制作效率与传播效果。

Silimini

Silimini是一款利用人工智能技术的动态表情生成工具,能够将静态照片转换为生动的动画表情。用户可通过选择模板并上传照片,一键生成个性化动态表情,支持高清视频保存与跨平台分享。其丰富的模板和简洁的操作流程使其广泛适用于社交媒体互动、节日祝福、个人娱乐及商业营销等多个领域。

DeepCoder

DeepCoder-14B-Preview 是一款基于 Deepseek-R1-Distilled-Qwen-14B 微调的开源代码生成模型,采用分布式强化学习技术,在 LiveCodeBench 基准上达到 60.6% 准确率。支持多语言代码生成、问题解决、补全优化、测试生成等功能,适用于开发、教育、竞赛等多个场景。项目提供完整训练数据与优化方案,推动 RL 在 LLM 中的应用。

万相2.1

通义万相2.1是一款基于自研VAE和DiT架构的AI视频生成工具,支持高精度视频编解码与中文文字生成,具备复杂动作展现、物理规律还原、中英文特效生成及艺术风格转换等功能。同时支持图像生成,适用于影视制作、广告视频、教学辅助、文化创作等多个领域,提供高效的创作体验与高质量输出。

Perplexica

Perplexica是一款开源的AI驱动搜索引擎,支持多模式搜索(如全网、学术、视频等),兼容本地大型语言模型,具备强大的自然语言理解和实时信息更新能力。适用于个人、学术、企业和教育场景,帮助用户高效获取所需信息。

Signs

Signs是由英伟达推出的AI手语学习平台,通过实时手势识别与3D虚拟教学,帮助用户精准掌握美式手语。平台支持用户上传视频,丰富学习资源,具备互动性与个性化反馈,适用于初学者及进阶学习者,同时为无障碍技术开发提供数据支持。