AI 每日要闻
🌙 月汐 · AI 每日精选 · 2026年06月15日
🔥 大黑AI速报
第1313期 - 2026-06-15 12:00
[技巧教程] 阿里云开发者分享搭建端到端业务需求专家Agent完整实践
阿里云发布实践链路,涵盖需求澄清、方案实现到验收环节,对AI工程化落地有指导意义。链接:https://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247561033&idx=1&sn=a9f9a3ac3dce5aee757e...
[行业资讯] 昆仑万维公布天工AI世界模型Matrix-Game 3.5技术突破
在智源大会上推出Matrix-Game 3.5,但具体细节尚不明确,对AI游戏和世界模型研究者有参考价值。链接:https://www.qbitai.com/2026/06/435520.html...
[产品工具] Command A Plus模型发布GGUF量化版本支持本地部署
社区发布Command A Plus的GGUF量化版,支持llama.cpp运行,便于本地部署和推理。详情:https://www.reddit.com/r/LocalLLaMA/comments/1u64t9i/command_a_plus_ggufs_posted/...
[技巧教程] 社区热议长时间Agent会话出现上下文污染问题
用户反馈长时间Agent会话中上下文污染导致性能下降,原因包括旧调试记录等,对开发者优化Agent会话有参考价值。讨论:https://www.reddit.com/r/LocalLLaMA/comments/1u6356v/do_long_agent_sessions_get_context_ro...
[产品工具] 开源项目Ironsmith:用本地模型创建个性化macOS应用
Ironsmith允许用户使用本地模型生成macOS应用,支持Gemma 4 E2B等小模型,展示本地AI应用潜力。项目地址:https://www.reddit.com/r/LocalLLaMA/comments/1u63qny/made_a_macos_app_that_creates_high...
👉 查看完整速报
第1312期 - 2026-06-15 08:01
[技巧教程] 27B小模型凭借Agent框架超越Anthropic Fable5
karminski-牙医分享Iterative-Contextual-Refinements框架,通过BFS探索+DFS优化+路由闭环,让Qwen3.6-27B在CGRE测试以95.5分超越Fable5的94.1分,代价是25-40x token消耗。框架:https://t.co/PuiNaqmU...
[模型动态] EAGLE推测解码正式合并到llama.cpp
EAGLE推测解码支持已合并入llama.cpp,可显著加速本地推理,对部署和优化有重要意义。Reddit社区热议。...
[技巧教程] 从零推导GPTQ量化补偿数学
Reddit用户从零推导GPTQ4-bit量化不破坏模型perplexity的原因——权重被视为相关而非独立变量,为量化理解提供理论基础。...
[产品工具] Pixel 10 Pro成功运行Gemma 12B模型
在Google Pixel 10 Pro上使用Termux运行Gemma 12B,功耗低于10瓦,达6.5pp 1.3tg,展示移动端运行中等模型的可行性。...
[产品工具] 开源AI代码审查工具lgtmaybe发布
lgtmaybe支持任意LLM提供商(含本地Ollama),并行审查并反射消除误报,保护隐私。项目地址:https://www.reddit.com/r/LocalLLaMA/comments/1u5yytz/building_lgtmaybe_a_pr_reviewer_for_any_model...
👉 查看完整速报
第1311期 - 2026-06-15 04:01
[模型动态] 小米发布MiMo V2.5模型,推理速度达1000-3000tps
小米推出MiMo V2.5,使用DFlash & Persistent kernel实现高速推理,并承诺即将开源。对AI从业者具有重要价值。...
[模型动态] 2026年6月本地VLM基准测试结果发布
Reddit社区发布最新本地VLM基准测试,系统比较各模型性能,为选择本地视觉模型提供参考。...
[产品工具] Harbor v0.5.0发布:一键启动多种本地推理后端
Harbor v0.5.0支持一键启动MLX、OMLX、llama.cpp等后端,自动连接Open WebUI等前端,简化本地部署。...
[产品工具] Aionforge Memory:基于Rust的Agent长期记忆层
推出Aionforge Memory,支持事件、事实、技能等多类型存储与检索,为Agent提供持久记忆能力。项目地址:https://www.reddit.com/r/LocalLLaMA/comments/1u5oyzl/aionforge_memory_long_term_agent_memor...
[技巧教程] Google推出5天Vibe Coding Kaggle课程,Zara Zhang分享演讲
Google推出5天Kaggle课程教授用自然语言构建Agent系统;同时Zara Zhang分享45分钟vibe coding演讲,涵盖产品构思与交互技巧。课程注册:https://t.co/0rbBE7cjmv...
👉 查看完整速报
📰 AI 行业快讯
1. PaddlePaddle/Paddle: PArallel Distributed Deep LEarning: Machine Learning Framework from Industrial Practice (『飞桨』核心框架,深度学习&机器学习高性能单机、分布式训练和跨平台部署)
📌 来源: 未知来源
👉 阅读原文
2. llm-jp/awesome-japanese-llm: 日本語LLMまとめ - Overview of Japanese LLMs
📌 来源: 未知来源
👉 阅读原文
3. Swiggy通过实时机器学习排序提升搜索自动补全效果
📌 来源: InfoQ 中文
👉 阅读原文
4. 写代码可以 Vibe Coding 了,为什么办公还不能 Vibe Officing?
📌 来源: InfoQ 中文
👉 阅读原文
5. Coding Agent 技术全景图:Context Engineering、Subagents 与 Harness,一年范式转移全解析
📌 来源: InfoQ 中文
👉 阅读原文
6. 线下活动|CiGA Game Jam 2026 广州荔湾少数派站召集令
📌 来源: 少数派
👉 阅读原文
7. 派早报:Fable 5 和 Mythos 5 模型因美国商务部禁令下线
📌 来源: 少数派
👉 阅读原文
8. 限时 15.49 万元起,华为乾崑智驾 ADS Pro 上车全新深蓝 S07 增程版
📌 来源: 爱范儿
👉 阅读原文
9. 早报|曝苹果iOS还有三项功能没公布/Claude Fable 5封禁内幕曝光/阿里巴巴:「周靖人离职」为谣言
📌 来源: 爱范儿
👉 阅读原文
10. HDC 2026 深度解构:鸿蒙全面向 Agent 架构演进,小艺做了这三件事
📌 来源: 爱范儿
👉 阅读原文
11. TDS REVIEW|韶音 OpenDots 2 / Air 耳夹式开放真无线耳机体验
📌 来源: 少数派
👉 阅读原文
🌙 感谢阅读 · 明日再见
版权声明
本文仅代表作者观点,不代表xx立场。
本文系作者授权xxx发表,未经许可,不得转载。


发表评论