AI项目与工具

CineMaster

CineMaster是快手推出的3D感知视频生成框架,支持通过文本提示及深度图、相机轨迹等控制信号生成高质量视频内容。其核心功能包括3D物体与摄像机控制、交互式设计、自动化数据标注和高质量视频输出。采用两阶段工作流程与扩散模型技术,结合语义布局控制网络与摄像机适配器,提升视频生成的精确度与灵活性。适用于影视制作、广告营销、游戏开发等多个领域。

Logome

Logome是一款基于AI技术的在线标志设计工具,能够根据用户输入的品牌信息快速生成多种标志方案,并支持风格、颜色和字体的自定义调整。同时提供品牌套件生成、智能设计建议以及高分辨率文件导出等功能,适用于初创企业、自由职业者和个人品牌建设,帮助用户高效打造专业且一致的品牌形象。

AniTalker

AniTalker是一款先进的AI工具,能将单张静态人像与音频同步转化为生动的动画对话视频。它通过自监督学习捕捉面部动态,采用通用运动表示和身份解耦技术减少对标记数据的依赖,同时结合扩散模型和方差适配器生成多样且可控的面部动画。AniTalker支持视频驱动和语音驱动两种方式,并具备实时控制动画生成的能力。

AsrTools

AsrTools是一款无需复杂配置的智能语音转文字工具,支持多种音频格式的转换,生成SRT和TXT字幕文件,适用于视频字幕、会议记录、音频转写等多个场景。它具有友好的用户界面、高效的多线程处理能力以及详细的技术文档,旨在为用户提供便捷、准确的语音转文字解决方案。

淘宝星辰

淘宝星辰是阿里妈妈推出的电商视频生成大模型,支持图片或文本指令生成高质量视频。具备智能商品展示、多语种语义理解、物理动作逻辑遵循及元素稳定性保障等功能,适用于商品主图、卖点展示、种草内容及虚拟试穿等场景,有效提升商品吸引力和转化效率。

攻壳智能体

攻壳智能体是一个整合AI工具与智能体资源的平台,提供精选工具推荐、社区交流和前沿技术追踪等功能。涵盖智能体、AI浏览器、聊天助手、内容生成、数据分析等多个类别,适用于学习、办公、创作等多样化场景,助力用户高效利用人工智能技术。

MetaStone

MetaStone-L1-7B 是一款轻量级推理模型,具备强大的数学和代码推理能力,性能达到行业领先水平。基于 DeepSeek-R1-Distill-Qwen-7B 架构,采用 GRPO 训练方式,支持多种计算架构并具备高效的云原生部署能力。适用于数学解题、编程辅助、智能客服、内容创作等多个场景,具有广泛的应用价值。

TrajectoryCrafter

TrajectoryCrafter是一种基于双流条件视频扩散模型的单目视频相机轨迹重定向工具,支持用户自定义相机运动路径并生成高质量、4D一致的视频内容。其核心技术包括解耦视图变换与内容生成、动态点云渲染以及混合数据集训练策略,具备强大的场景泛化能力。适用于沉浸式娱乐、视频创作、智能会议、自动驾驶及教育等多个领域。

LinFusion

LinFusion 是一种创新的图像生成模型,基于线性注意力机制高效处理高分辨率图像生成任务。它在处理大量像素时保持计算复杂度线性增长,显著提高生成效率。LinFusion 支持零样本跨分辨率生成,并与预训练模型组件如 ControlNet 和 IP-Adapter 兼容。在单个 GPU 上,LinFusion 能够生成高达 16K 分辨率的图像,广泛应用于艺术创作、游戏设计、虚拟现实等领域。

陌生人闹钟

陌生人闹钟是一款结合AI技术和社交互动的创新闹钟应用,用户每天早晨可被随机陌生人的语音唤醒。具备AI内容过滤、个性化设置、多语言支持及复古设计等特点,支持用户录制和分享声音,促进全球范围内的社交互动,同时适用于日常生活、语言学习、情感支持等多种场景。