IT

麻省理工学院

麻省理工学院(Massachusetts Institute of Technology),简称“麻省理工”(MIT),创立于1861年,位于美国马萨诸塞州波士顿都市区剑桥市,主校区依查尔斯河而建,是一所享誉世界...

Toolkit

Toolkit,人像背景Ai抠图,上传图片,系统会自动去识别主体,然后去除背景。也可以对毛发等复杂的对象进行抠图。

iThinkScene

灵境之城旗下的产品,iThinkAi平台的产品涵盖多个领域,包括iThinkAi工具集、iThinkChat和iThinkScene

ChatPaper

ChatPaper是一款集检索、阅读、知识问答于一体的文献知识工具,专为科研人员设计,旨在提高检索和阅读论文的效率,快速获取最新领域研究动态。它利用ChatGPT3.5的API接口,能够根...

Ruyi

Ruyi是一款基于DiT架构的图生视频大模型,支持多分辨率和多时长的视频生成,具有首帧、首尾帧控制、运动幅度调整及镜头方向控制等功能。它通过Casual VAE模块和Diffusion Transformer实现视频数据的压缩与生成,旨在降低动漫和游戏内容的开发周期和成本。目前,Ruyi-Mini-7B版本已开源。

SearchAgent

SearchAgent-X是由南开大学和伊利诺伊大学厄巴纳香槟分校(UIUC)研究人员开发的高效推理框架,旨在提升基于大型语言模型(LLM)的搜索Agent效率。通过高召回率的近似检索、优先级感知调度和无停顿检索等技术,显著提高系统吞吐量(1.3至3.4倍),降低延迟(降至原来的1/1.7至1/5),同时保持生成质量。该框架优化资源利用率,适用于智能客服、搜索引擎、企业知识管理等多种场景,为复杂A

MultiTalk

MultiTalk是由中山大学深圳校区、美团和香港科技大学联合推出的音频驱动多人对话视频生成框架。它根据多声道音频输入、参考图像和文本提示,生成包含人物互动且口型与音频一致的视频。通过Label Rotary Position Embedding (L-RoPE) 方法解决多声道音频与人物绑定问题,并采用部分参数训练和多任务训练策略,保留基础模型的指令跟随能力。MultiTalk适用于卡通、歌唱及

Midreal AI

Midreal AI可以生成真正的小说,逻辑性和创造力都在线,而且还加入了互动能力,每到关键节点会让你选择剧情走向,还会生成一张配图。

Reddit翻译助手

突破语言障碍,Reddit翻译助手让你可以用中文在Reddit上畅聊,无缝翻译帖子内容,,用中文写评论,自动转英文发布,支持一键翻译评论区。

T

T-Rex Label是一款基于AI的自动标注工具,依托T-Rex2模型实现一键标注和零样本检测功能。它通过视觉提示简化标注流程,无需额外训练即可直接应用于多种场景,包括农业、工业、生物医药等。用户可通过GitHub账号快速登录并上传数据,利用AI自动生成初步标注结果,随后人工检查与修正,最终导出为常用格式供模型训练使用。