AI项目

GLM-4.6V – 智谱开源的多模态大模型系列

GLM-4.6V 是智谱推出的多模态大模型,包含面向云端与高性能集群场景的基础版GLM-4.6V(106B-A12B)和面向本地部署与低延迟应用的轻量版GLM-4.6V-Flash(9B)。

PixSprout – 在线AI印章生成工具,创建个性化数字印章

PixSprout 是在线 AI 印章生成工具,让用户能快速创建个性化数字印章。支持通过文字描述生成印章,或是上传图片或Logo转换为印章。生成的印章为高清透明PNG格式,无背景,适合多种应用场景,如文件盖章、品牌设计等。

CyberCut – 快手StreamLake推出的AI视频剪辑工具

CyberCut 是快手旗下 StreamLake 推出的 AI 视频制作工具,专为创作者和营销团队设计。工具能将长视频智能剪辑成适合社交媒体传播的短视频,能根据脚本生成营销视频。

LongCat-Image – 美团推出的开源图像生成模型

LongCat-Image 是美团开源的高性能图像生成模型,仅用 6B 参数在文生图和图像编辑上达到开源顶尖水平。模型采用创新架构和训练策略,支持高质量中文文字渲染,覆盖 8105 个汉字,适用海报、广告等设计场景。

混元2.0 – 腾讯混元最新推出的智能语言模型

混元2.0是腾讯混元最新发布的先进人工智能语言模型,包括Tencent HY 2.0 Think和Tencent HY 2.0 Instruct两个版本。采用混合专家(MoE)架构,拥有4060亿总参数量和320亿激活参数,支持256K上下文窗口。

NewBie-image-Exp0.1 – NewBieAi Lab开源的图像生成模型

NewBie-image-Exp0.1 是 NewBieAi Lab 开源的实验性图像生成模型,基于 Next-DiT 架构,参数量为 3.5B。模型使用 full dan + 1m e621 数据集进行预训练,并在 8×h200 硬件上训练了四个月,累计约 23000 h200 小时。

RoboCOIN – 智源联合多所高校开源的具身智能数据集

RoboCOIN是北京智源人工智能研究院联合多所高校和企业发布的具身智能数据集。包含超过18万条演示数据,覆盖421种任务和16个不同场景,如家庭、商业、工厂等。数据采集自15种不同的机器人平台,涵盖双臂机器人、半人形机器人和人形机器人,提供多视角的RGB和深度图像以及详细的运动学状态。

Guideflow – AI交互式演示平台,快速捕捉产品操作流程

Guideflow 是强大的AI交互式演示平台,专为快速创建和分享高质量的交互式指南与演示而设计。用户只需通过浏览器点击几下,可在几秒钟内捕获网站或应用程序的操作流程,生成交互式指南。

Pallas AI – AI营销增长Agent工具,品牌自动分析诊断

Pallas AI 是专注于 AI 营销的智能工具,通过自动化的方式帮助企业优化品牌在 AI 平台上的表现。通过 AI Agent 技术,简化了生成式引擎优化(GEO)的流程,能自动完成从数据监控、内容生成到品牌洞察的全流程任务。

Gemini3 DeepThink – 谷歌推出的超强推理模型

Gemini 3 Deep Think 是谷歌 DeepMind 推出的超强推理模型,具备并行思考能力,可同时探索多个假设,选择最优答案路径。

Workspace Studio – 谷歌推出的AI智能体构建工具

Workspace Studio 是谷歌推出的 AI 自动化工具,用户可通过自然语言描述任务,基于 Gemini 模型快速生成定制化的 AI 智能体,实现复杂工作流程的自动化。工具支持与 Google Workspace 套件及 Asana、Jira 等第三方工具无缝集成,打破数据孤岛,构建综合自动化流程。

Defapi – AI模型API聚合平台,轻松集成全球顶级AI模型

Defapi 是领先的 AI 模型 API 聚合平台,为开发者提供统一接口,轻松集成全球顶级 AI 模型,如 OpenAI、Anthropic 和 Google 等。通过智能路由优化成本,自动选择最具性价比的模型,帮助用户降低使用成本。

Drama.Land – AI内容创作平台,创意到视频一站式解决方案

Drama.Land(DramaStudio.ai)是创新的AI驱动内容创作平台,帮助创作者轻松将创意转化为戏剧或视频内容。通过集成AI技术,平台提供一站式解决方案,涵盖从剧本创作、分镜头绘制到配音、表演和后期编辑的全流程。

Maimo – 专注于信息处理和知识管理的AI工作平台

Maimo是专注于行业研究的AI工作空间,帮助用户高效管理和分析各类信息。通过定制化的分析功能,能够在短时间内从大量信息中提取关键知识,为用户提供精准的洞察。平台支持多种格式的内容,包括文档、YouTube视频、音频文件和播客,方便用户集中管理不同来源的信息。

Flowra – 魔搭联合呜哩WULI团队开源的AI工作流开发工具

Flowra 是 ModelScope 联合呜哩WULI 团队开源的 AI 工作流开发工具,是 FlowBench 的核心引擎。工具提供图执行引擎和节点包开发工具链,支持丰富的类型系统、DAG 执行引擎、智能缓存、分布式调度等功能。

Seedream 4.5 – 字节跳动推出的图像创作模型

Seedream 4.5(Doubao-Seedream-4.5)是字节跳动团队推出的豆包图像创作模型,专为商业生产力场景设计。模型在主体一致性、指令精准度、空间逻辑和美学表现力等方面全面升级,尤其强化多图组合生成能力,确保多源素材融合自然一致。

可灵2.6 – 快手可灵推出音画同出的AI视频生成模型

可灵2.6是可灵AI团队推出的创新AI视频创作模型,实现了音画同步生成,能通过文本或图片输入,自动生成包含自然语音、匹配音效和环境氛围的视频。

TalkCody – 开源AI编程助手,即时体验最新模型

TalkCody 是开源的 AI 编程助手,帮助开发者更高效地构建软件。采用 Rust 和 Tauri 构建,具备原生性能和低资源占用的特点。TalkCody 支持多模型自由切换,涵盖 50 多种主流 AI 模型,如 OpenAI、Claude 和 Gemini 等,用户可即时体验最新模型。

Amazon Nova 2 – 亚马逊推出的第二代自研AI模型系列

Amazon Nova 2 是亚马逊云科技(AWS)推出的一系列先进AI模型,专为企业多样化需求设计。Amazon Nova 2 系列包含四款模型:Nova 2 Lite(成本优化的文本生成模型,支持文本、图像和视频处理);Nova 2 Pro(高级推理模型,适用于复杂任务,如编程);Nova 2 Sonic(语音到语音模型,用于对话式AI)。

MemMachine – 开源AI记忆系统,支持多种记忆类型

MemMachine是开源的AI记忆系统,专为AI Agent设计,提供短期、长期和个性化记忆功能。MemMachine通过情景记忆、语义记忆和用户画像记忆,帮助AI应用学习、存储和回忆过往会话数据,提升交互体验。