AI项目与工具

Tersa

Tersa 是一款开源免费的 AI 工作流构建平台,提供直观的拖放界面,支持 77 个主流 AI 模型,如 GPT-4o、Claude 3.5 Sonnet、DALL-E 3 和 Whisper 等,适用于文本生成、图像视频创作、音频转录和代码优化等多种任务。用户可通过拖放文件快速构建复杂流程,无需编程基础,广泛应用于内容生成、代码审查、原型开发和多模态功能集成等领域。

Kimi i人嘴替

Kimi i人嘴替是一款基于AI技术开发的沟通辅助工具,主要服务于希望改善人际交往能力的用户。其核心功能包括即时文案生成、社交场景应对指导以及心理建设支持等。此外,该工具还能灵活运用网络流行语,让交流过程更加生动有趣。无论是面对日常对话还是复杂的人际挑战,i人嘴替都能提供有效的解决方案。

Flex3D

Flex3D是一款由Meta和牛津大学联合研发的两阶段3D生成框架,通过多视图扩散模型和视图筛选机制生成高质量3D模型,支持从文本、单张图片或稀疏视图生成逼真的3D内容。其核心在于基于Transformer架构的灵活重建模型(FlexRM),结合三平面表示与3D高斯绘制技术,实现高效且详细的三维重建,广泛应用于游戏开发、AR/VR、影视制作等领域。

源2.0

源2.0-M32是由浪潮信息开发的一种混合专家模型(MoE),包含32个专家,采用“注意力路由器”技术,显著提升了模型的效率和准确性。该模型在代码生成、数学问题解决、科学推理等多个领域表现出色,尤其在ARC-C和MATH基准测试中超越了其他模型。源2.0-M32具有高效的计算能力和广泛的适用性,适用于多种复杂任务。

UniTok

UniTok是由字节跳动联合高校研发的统一视觉分词器,支持视觉生成与理解任务。其采用多码本量化技术,将视觉特征分割并独立量化,显著提升离散token的表示能力。在ImageNet上实现78.6%的零样本分类准确率,图像重建质量达0.38。可作为多模态大语言模型的视觉输入模块,广泛应用于图像生成、视觉问答、内容创作及跨模态检索等场景。

Talkpal AI

Talkpal AI是一款利用GPT技术构建的语言学习平台,支持多语言学习,包括英语、西班牙语、法语和德语等。其主要功能涵盖自适应学习系统、角色扮演、情景对话、听力及口语练习,并提供即时反馈,助力用户提升语言实际应用能力。

adAI艾达艾

adAI艾达艾是一款基于AI技术的在线PPT生成工具,能够快速生成高质量的图文并茂PPT文档。用户只需输入需求描述,工具便能智能匹配内容与图片,生成符合要求的PPT文件。此外,它提供免费下载服务,支持多种编辑软件,并允许用户自定义语言及背景风格。主要应用场景包括商务演示、教育培训、会议报告以及个人简历等。

Databricks SQL

Databricks SQL 是一款基于湖仓架构的智能数据仓库服务,支持统一的数据分析、自然语言查询和自动化优化。它通过 Delta Lake 和 Unity Catalog 实现高性能数据处理和元数据管理,适用于数据仓库现代化、实时分析、数据探索及预测建模等场景。

鱼鳞智慧脑图

鱼鳞智慧脑图是一款AI驱动的思维导图工具,可将文本、网页链接、PDF和Word文件自动转换为结构化导图,提升信息整理效率。支持主题扩展、在线协作与多格式导出,适用于学习、研究、项目管理等场景,操作简便,适合各类用户使用。

STIV

STIV是一款由苹果公司开发的视频生成大模型,具有8.7亿参数,擅长文本到视频(T2V)及文本图像到视频(TI2V)任务。它通过联合图像-文本分类器自由引导(JIT-CFG)技术提升生成质量,并结合时空注意力机制、旋转位置编码(RoPE)及流匹配训练目标优化性能。STIV支持多种应用场景,包括视频预测、帧插值、长视频生成等,适用于娱乐、教育、广告及自动驾驶等多个领域。