AI项目与工具

SimpleAR

SimpleAR是一款由复旦大学与字节跳动联合研发的纯自回归图像生成模型,采用简洁架构实现高质量图像生成。其通过“预训练-有监督微调-强化学习”三阶段训练方法,提升文本跟随能力与生成效果。支持文本到图像及多模态融合生成,兼容加速技术,推理速度快。适用于创意设计、虚拟场景构建、多模态翻译、AR/VR等多个领域。

什么是机器人流程自动化(Robotic Process Automation, RPA)

机器人流程自动化(RPA)是一种通过模拟人类操作实现业务流程自动化的软件技术,主要应用于财务、人力资源、客户服务等领域。其核心技术包括软件机器人和控制中心,能够显著提升效率、减少错误、降低成本。结合人工智能后,RPA还能处理更复杂的认知任务,但需应对系统集成、数据安全及定制化需求等挑战。

通古大模型

通古大模型是由华南理工大学研发的古籍文言文处理AI工具,基于百川2-7B-Base进行增量预训练,结合24.1亿古籍语料和400万对话数据,采用RAT和RAG技术提升古籍处理效果。支持古文句读、文白翻译、诗词创作、古籍赏析、检索问答及辅助整理等功能,广泛应用于古籍数字化、教育、文化传承与学术研究等领域。

Video Ocean V2.0

Video Ocean V2.0是一款由潞晨科技推出的AI视频生成平台,支持文生视频、图生视频和角色生视频等多种创作方式。平台具备高画质、多风格切换及视频续写、重试等编辑功能,适用于个人创作、自媒体、教育及影视前期构思等多个场景,提升视频制作效率与创意表达能力。

DreamPolish

DreamPolish是一款基于文本输入生成高质量3D模型的AI工具,其创新点在于采用两阶段方法优化几何与纹理:第一阶段通过神经网络逐步细化几何形状,第二阶段利用领域得分蒸馏技术生成逼真的纹理。该工具支持复杂对象的精细建模,并广泛应用于虚拟现实、影视特效、游戏开发及教育培训等领域,为3D内容创作提供高效解决方案。

PaperOMG

PaperOMG是一款集论文写作、查重、降重和PPT制作于一体的AI辅助工具,支持开题报告、文献综述和初稿撰写等功能。其查重系统基于指纹比对技术,覆盖大量学术资源,准确率高。平台还提供多种查重版本及降重策略,帮助用户提升论文原创性,保障学术规范。

Ingredients

Ingredients是一款基于多身份图像与视频扩散Transformer的视频生成框架,支持多身份特征的高效整合与动态分配。其核心模块包括面部提取器、多尺度投影器和ID路由器,能够保持身份一致性并生成高质量视频内容。无需额外训练即可实现个性化视频制作,适用于娱乐、广告、教育等多个领域。

MoneyPrinterPlus

MoneyPrinterPlus是一款基于AI技术的短视频生成工具,能够实现一键批量生成并自动混剪短视频。该工具支持将视频自动发布至多个社交平台,简化了视频内容创作流程。MoneyPrinterPlus的核心功能包括AI一键批量生成短视频、自动批量混剪、自动发布到社交平台、支持本地和云语音服务以及AI生图功能。

Index

Index-AniSora是由哔哩哔哩开发的动漫视频生成模型,支持多种动画风格的生成,涵盖番剧、国创、VTuber等内容。其核心技术包括扩散模型、时空掩码模块和Transformer架构,具备图像到视频生成、帧插值、局部引导等能力。模型提供高质量数据集,适用于动画制作、创意验证、教育及营销等多个领域。

OpusClip

OpusClip 是一款基于人工智能的视频剪辑工具,能够将长视频自动转换为适合社交媒体传播的短视频。其核心功能包括自动剪辑、多平台发布、字幕生成与翻译、智能人脸追踪、关键词高亮等。用户可通过简单操作快速生成多个短视频版本,并支持品牌模板定制和团队协作。适用于社交媒体运营、营销推广、教育、新闻及音频内容转化等多种场景。