AR

Zerox

Zerox是一款基于GPT-4o-mini模型的开源OCR工具,支持多种文件格式,具备零样本识别能力,可高效处理扫描文档和复杂布局内容。其输出为Markdown格式,便于编辑与使用,同时提供API接口,适用于企业文档管理、学术研究、法律金融等多个场景,显著提升文档处理效率和准确性。

优雅简历

易使用,安全,功能强大,不要钱的在线简历制作工具

ScrapeGraphAI

ScrapeGraphAI 是一款基于大型语言模型(LLM)的智能网络爬虫工具包,能够高效提取结构化数据。其核心功能包括 SmartScraper、SearchScraper 和 Markdownify,支持自然语言驱动的爬取、多页面搜索、自适应爬取、多模型和多平台兼容,可生成代码并存储为 CSV 或 JSON 格式。适用于市场分析、学术研究、产品信息收集等场景。

Genmo AI

Designs.ai Videomaker是一个创新的在线工具,它通过AI技术简化了视频制作流程,使得用户能够快速、轻松地创作出专业级别的视频内容。

MultiTalk

MultiTalk是由中山大学深圳校区、美团和香港科技大学联合推出的音频驱动多人对话视频生成框架。它根据多声道音频输入、参考图像和文本提示,生成包含人物互动且口型与音频一致的视频。通过Label Rotary Position Embedding (L-RoPE) 方法解决多声道音频与人物绑定问题,并采用部分参数训练和多任务训练策略,保留基础模型的指令跟随能力。MultiTalk适用于卡通、歌唱及

SearchAgent

SearchAgent-X是由南开大学和伊利诺伊大学厄巴纳香槟分校(UIUC)研究人员开发的高效推理框架,旨在提升基于大型语言模型(LLM)的搜索Agent效率。通过高召回率的近似检索、优先级感知调度和无停顿检索等技术,显著提高系统吞吐量(1.3至3.4倍),降低延迟(降至原来的1/1.7至1/5),同时保持生成质量。该框架优化资源利用率,适用于智能客服、搜索引擎、企业知识管理等多种场景,为复杂A

VARGPT

VARGPT是一款多模态大语言模型,整合了视觉理解和生成任务于统一的自回归框架中。它通过next-token和next-scale预测机制,支持文本与图像的混合输入和输出,具备高效的视觉生成能力。模型采用三阶段训练策略,提升了在视觉问答、推理及图像生成任务中的表现。适用于多模态内容创作、指令到图像合成等场景。

MagicArticulate

MagicArticulate是由南洋理工大学与字节跳动Seed实验室联合开发的3D模型动画化工具,支持自动骨架生成、蒙皮权重预测及高质量动画输出。其基于自回归Transformer架构,结合Articulation-XL大规模数据集,实现对多样化3D模型的高效处理。适用于3D动画、游戏开发、VR/AR、工业设计等多个领域,显著提升动画制作效率与质量。

YouTube Summarized

YouTube Summarizedm,这是一个使用人工智能为您总结YouTube视频的网站,还可以可以帮助用户创建笔记或分享视频的精彩片段。

ChatPaper

ChatPaper是一款集检索、阅读、知识问答于一体的文献知识工具,专为科研人员设计,旨在提高检索和阅读论文的效率,快速获取最新领域研究动态。它利用ChatGPT3.5的API接口,能够根...