GLM-4.6V – 智谱开源的多模态大模型系列

GLM-4.6V 是智谱推出的多模态大模型,包含面向云端与高性能集群场景的基础版GLM-4.6V(106B-A12B)和面向本地部署与低延迟应用的轻量版GLM-4.6V-Flash(9B)。

Openrouter发布《基于100万亿Token数据的AI现状报告》

在当今数字化时代,人工智能(AI)尤其是大型语言模型(LLMs)正以前所未有的速度改变着我们的世界。关于模型在实际应用中的真实使用情况和影响,我们仍缺乏系统性的实证研究。

PixSprout – 在线AI印章生成工具,创建个性化数字印章

PixSprout 是在线 AI 印章生成工具,让用户能快速创建个性化数字印章。支持通过文字描述生成印章,或是上传图片或Logo转换为印章。生成的印章为高清透明PNG格式,无背景,适合多种应用场景,如文件盖章、品牌设计等。

CyberCut – 快手StreamLake推出的AI视频剪辑工具

CyberCut 是快手旗下 StreamLake 推出的 AI 视频制作工具,专为创作者和营销团队设计。工具能将长视频智能剪辑成适合社交媒体传播的短视频,能根据脚本生成营销视频。

LongCat-Image – 美团推出的开源图像生成模型

LongCat-Image 是美团开源的高性能图像生成模型,仅用 6B 参数在文生图和图像编辑上达到开源顶尖水平。模型采用创新架构和训练策略,支持高质量中文文字渲染,覆盖 8105 个汉字,适用海报、广告等设计场景。

混元2.0 – 腾讯混元最新推出的智能语言模型

混元2.0是腾讯混元最新发布的先进人工智能语言模型,包括Tencent HY 2.0 Think和Tencent HY 2.0 Instruct两个版本。采用混合专家(MoE)架构,拥有4060亿总参数量和320亿激活参数,支持256K上下文窗口。

NewBie-image-Exp0.1 – NewBieAi Lab开源的图像生成模型

NewBie-image-Exp0.1 是 NewBieAi Lab 开源的实验性图像生成模型,基于 Next-DiT 架构,参数量为 3.5B。模型使用 full dan + 1m e621 数据集进行预训练,并在 8×h200 硬件上训练了四个月,累计约 23000 h200 小时。

RoboCOIN – 智源联合多所高校开源的具身智能数据集

RoboCOIN是北京智源人工智能研究院联合多所高校和企业发布的具身智能数据集。包含超过18万条演示数据,覆盖421种任务和16个不同场景,如家庭、商业、工厂等。数据采集自15种不同的机器人平台,涵盖双臂机器人、半人形机器人和人形机器人,提供多视角的RGB和深度图像以及详细的运动学状态。

Guideflow – AI交互式演示平台,快速捕捉产品操作流程

Guideflow 是强大的AI交互式演示平台,专为快速创建和分享高质量的交互式指南与演示而设计。用户只需通过浏览器点击几下,可在几秒钟内捕获网站或应用程序的操作流程,生成交互式指南。

Pallas AI – AI营销增长Agent工具,品牌自动分析诊断

Pallas AI 是专注于 AI 营销的智能工具,通过自动化的方式帮助企业优化品牌在 AI 平台上的表现。通过 AI Agent 技术,简化了生成式引擎优化(GEO)的流程,能自动完成从数据监控、内容生成到品牌洞察的全流程任务。

CodeFlying海外版实测,一句话生成应用自动部署上线

“有没有适合小学生学成语的工具”、“我想做一个游戏小程序,用什么工具合适”、“我有一个超绝的想法,你能不能帮我做出来”...有些小众的场景,很难找到现成、合适的应用;自己有好的想法,却苦于没有技术实现。最近发现在海外爆火的一款应用,花几分钟就能生成的定制版学习应用。

Gemini3 DeepThink – 谷歌推出的超强推理模型

Gemini 3 Deep Think 是谷歌 DeepMind 推出的超强推理模型,具备并行思考能力,可同时探索多个假设,选择最优答案路径。

Workspace Studio – 谷歌推出的AI智能体构建工具

Workspace Studio 是谷歌推出的 AI 自动化工具,用户可通过自然语言描述任务,基于 Gemini 模型快速生成定制化的 AI 智能体,实现复杂工作流程的自动化。工具支持与 Google Workspace 套件及 Asana、Jira 等第三方工具无缝集成,打破数据孤岛,构建综合自动化流程。

Defapi – AI模型API聚合平台,轻松集成全球顶级AI模型

Defapi 是领先的 AI 模型 API 聚合平台,为开发者提供统一接口,轻松集成全球顶级 AI 模型,如 OpenAI、Anthropic 和 Google 等。通过智能路由优化成本,自动选择最具性价比的模型,帮助用户降低使用成本。

Drama.Land – AI内容创作平台,创意到视频一站式解决方案

Drama.Land(DramaStudio.ai)是创新的AI驱动内容创作平台,帮助创作者轻松将创意转化为戏剧或视频内容。通过集成AI技术,平台提供一站式解决方案,涵盖从剧本创作、分镜头绘制到配音、表演和后期编辑的全流程。

Maimo – 专注于信息处理和知识管理的AI工作平台

Maimo是专注于行业研究的AI工作空间,帮助用户高效管理和分析各类信息。通过定制化的分析功能,能够在短时间内从大量信息中提取关键知识,为用户提供精准的洞察。平台支持多种格式的内容,包括文档、YouTube视频、音频文件和播客,方便用户集中管理不同来源的信息。

Flowra – 魔搭联合呜哩WULI团队开源的AI工作流开发工具

Flowra 是 ModelScope 联合呜哩WULI 团队开源的 AI 工作流开发工具,是 FlowBench 的核心引擎。工具提供图执行引擎和节点包开发工具链,支持丰富的类型系统、DAG 执行引擎、智能缓存、分布式调度等功能。

Seedream 4.5 – 字节跳动推出的图像创作模型

Seedream 4.5(Doubao-Seedream-4.5)是字节跳动团队推出的豆包图像创作模型,专为商业生产力场景设计。模型在主体一致性、指令精准度、空间逻辑和美学表现力等方面全面升级,尤其强化多图组合生成能力,确保多源素材融合自然一致。

可灵2.6 – 快手可灵推出音画同出的AI视频生成模型

可灵2.6是可灵AI团队推出的创新AI视频创作模型,实现了音画同步生成,能通过文本或图片输入,自动生成包含自然语音、匹配音效和环境氛围的视频。

如何用千问APP做音画同步视频,附教程案例

最近发现千问App又更新啦。这次是创作能力的全面升级,融入了最新图像模型 Qwen-Image-Edit 的生图和改图能力,Wan2.5的音视频能力,一张图片,可以生成会说话、会唱歌、口型精准的高清视频。普通人,不会剪辑,也能直接上手做出完整的短视频内容。