AI项目与工具

元镜

元镜是一款基于人机共生引擎的AI视频创作工具,支持从创意脚本生成到成片输出的全流程制作。具备多模态分镜设计、智能工作流和一键成片功能,提升视频创作效率与质量。适用于短视频、广告、教育、影视及政务宣传等多个领域,满足多样化内容生产需求。

S10.AI

S10.AI是一款基于人工智能的医疗辅助工具,主要功能包括实时生成精准的临床记录、EHR系统集成、自动化编码以及临床决策支持。它通过语音识别技术简化医生的工作流程,显著提升工作效率,同时保障数据安全与隐私合规。该工具适用于各类医疗机构、心理治疗机构及独立诊所,支持多语言转录并提供高度自定义选项。

NoteGPT

NoteGPT是一款利用AI技术(如ChatGPT和Claude 3)开发的内容摘要工具,支持对YouTube视频、网页及PDF文档进行快速总结。其主要功能包括生成视频概要、提取关键点、制作思维导图、自动转录、笔记管理和多语言翻译等,广泛应用于学习、研究、职场和内容创作等领域,帮助用户高效获取和整理信息。

DICE

DICE-Talk是由复旦大学与腾讯优图实验室联合开发的动态肖像生成框架,能够根据音频和参考图像生成具有情感表达的高质量视频。其核心在于情感与身份的解耦建模,结合情感关联增强和判别机制,确保生成内容的情感一致性与视觉质量。该工具支持多模态输入,具备良好的泛化能力和用户自定义功能,适用于数字人、影视制作、VR/AR、教育及心理健康等多个领域。

RF

RF-DETR是一款由Roboflow推出的实时目标检测模型,支持多分辨率训练,具备高精度和低延迟特性,在COCO数据集上达到60+ mAP。结合Transformer架构和预训练DINOv2主干,提升领域适应性和检测效果。适用于安防、自动驾驶、工业检测等多个场景,提供预训练检查点以支持快速微调和部署。

MindLLM

MindLLM是由多所高校联合开发的AI模型,可将功能性磁共振成像(fMRI)信号解码为自然语言文本。其采用主体无关的fMRI编码器与大型语言模型结合,并引入脑指令调优技术,实现跨个体的高精度解码。该模型在多项任务中表现优异,具备广泛的应用潜力,包括医疗康复、脑机接口、神经科学研究及人机交互等领域。

Qihoo

Qihoo-T2X是由360 AI研究院与中山大学联合研发的高效多模态生成模型,基于代理标记化扩散 Transformer(PT-DiT)架构。该模型通过稀疏代理标记注意力机制显著降低计算复杂度,支持文本到图像、视频及多视图生成。具备高效生成能力和多任务适应性,适用于创意设计、视频制作、教育、游戏开发及广告等多个领域。

SmolDocling

SmolDocling-256M-preview 是一款轻量级多模态文档处理模型,能将图像文档高效转换为结构化文本,支持文本、公式、图表等多种元素识别。模型参数量仅256M,推理速度快,适合学术与技术文档处理。具备OCR、布局识别、格式导出等功能,并兼容Docling,适用于文档数字化、科学研究及移动环境应用。

Janitor AI

Janitor AI是一个提供个性化虚拟角色创作的平台,用户可以创建和管理独特的虚拟角色,并浏览其他用户的创作。该平台还集成了社交媒体链接,便于用户在多个平台上进行互动。主要功能包括角色广场、聊天分享、创建角色和社交属性,应用场景广泛,可用于游戏、社交媒体营销、内容创作和虚拟社区参与。

DoraCycle

DoraCycle是由新加坡国立大学Show Lab开发的一种多模态生成模型,通过文本与图像间的双向循环一致性学习,实现跨模态信息转换与对齐。其核心优势在于无需大量标注数据即可完成领域适应,支持风格化设计、虚拟角色生成等多样化任务。模型采用自监督学习和梯度裁剪等技术提升训练稳定性,适用于广告、教育等多个应用场景。