AI项目与工具

TokenVerse

TokenVerse 是一种基于扩散模型的多概念图像生成工具,支持从单图或多图中解耦并组合视觉元素,如物体、材质、姿势等。通过优化调制空间,实现对复杂概念的局部控制,无需微调模型即可生成个性化图像,适用于创意设计、艺术创作和内容生成等多种场景。

AIVLOG

AIVLOG是一款基于AI技术的视频编辑工具,专为视频创作者设计,具备自动剪辑、智能字幕生成、特效与音乐一键添加等功能。支持多平台使用,提供丰富的模板和素材,便于快速制作高质量Vlog,并可一键分享至社交平台,提升内容传播效率。

BoldVoice

BoldVoice 是一款专注于英语发音训练的工具,结合专业口音课程与AI语音分析技术,帮助非英语母语者提升发音准确性和口语自信。用户可通过录音获得实时反馈与改进建议,并根据个人母语背景定制学习计划。应用还提供发音测试、口音对比和多场景练习功能,适用于职场、考试、日常交流及表演等领域,有效提升英语口语能力。

llmware

llmware是一款面向企业级应用的统一框架,专注于构建基于小型、专业模型的RAG(检索增强生成)流程。它支持私有部署,可安全集成企业知识源,并提供模型目录、库管理、查询接口及RAG优化模型等功能,以降低开发成本并提升效率。适用于知识管理、自动化流程、数据分析及金融、法律等行业,是企业AI应用开发的理想工具。

ELSA Speak

ELSA Speak是一款AI驱动的英语学习工具,专注于提升用户的发音、语法、词汇及沟通能力。它提供即时发音反馈、个性化学习计划、水平评估测试以及趣味化学习内容,适用于个人学习、课堂教学、企业培训等多种场景,助力用户在学术和职业发展中提升英语水平。

Harvey

Harvey是一款基于GPT-4的法律AI平台,专为法律从业者设计,提供法律研究、文档分析、合同审查、文件起草及工作流自动化等功能。支持多司法管辖区应用,提升法律工作的效率与准确性,助力律师专注于高价值任务。

FilmAgent

FilmAgent是一款由哈尔滨工业大学(深圳)研发的虚拟电影制作工具,基于多智能体协作框架,实现从剧本创作到镜头拍摄的全流程自动化。支持剧本生成、多智能体协作、镜头规划、语音合成等功能,适用于创意视频制作、影视教学及虚拟场景应用。系统在Unity 3D环境中运行,提升电影制作效率与创意表达能力。

Whisper Input

Whisper Input 是一款开源语音输入工具,基于 Python 和 OpenAI Whisper 模型开发,支持多语言语音识别与实时转录。用户可通过快捷键操作录音并生成文本,具备翻译、自动标点、高效处理及本地运行等功能。适用于会议记录、教育、智能交互及媒体制作等多种场景。

Fast3R

Fast3R是一种基于Transformer架构的高效多视图3D重建方法,可在单次前向传播中处理上千张图像,大幅提高重建效率并减少误差累积。支持多视图并行处理,具备高精度、强可扩展性和快速推理能力,适用于机器人视觉、增强现实、虚拟现实、文化遗产保护及自动驾驶等多个场景。

ZMO.AI

ZMO.AI 是一款多功能的 AI 图像生成与编辑平台,支持文本或图片输入生成艺术作品、动漫、照片等,具备照片编辑、背景更换、风格迁移等功能。适用于电商、社交媒体、广告设计、数字艺术等领域,帮助用户高效创作高质量视觉内容。