搜索文章
首页
Hello Halo
Halo
关于
首页
Hello Halo
Halo
关于
# Java
(0)
# 工具
(72)
# AI
(43)
# Halo
(0)
TOON 教程:把 JSON 数据喂给模型前,先把 token 账算明白
很多人做 AI 应用时,第一反应是把业务数据直接塞成 JSON。简单、通用、模型也能读,看起来没毛病。 但一到真实场景,账就不太对了。订单列表、埋点日志、知识库片段、搜索结果、用户画像、商品属性,全都用 JSON 喂给模型,会浪费大量字段名、括号和重复结构。上下文窗口再大,也不能这么霍霍。 TOON 的价值就在这里。它
作者:Administrator
发布时间:2026-04-29
分类:
技术教程
标签:
#
AI
IBM Granite 4.1:小模型路线没输,输的是粗糙训练
IBM Granite 4.1 的发布,很适合给开源模型圈泼一点冷静水:小模型路线没有输,输的是粗糙训练和粗糙定位。 Granite 4.1 是 3B、8B、30B 的 dense decoder-only 模型家族,训练管线包含约 15T tokens、多阶段预训练、长上下文扩展、监督微调和多阶段强化学习。更关键的是
作者:Administrator
发布时间:2026-04-29
分类:
AI观察
标签:
#
AI
Google 第八代 TPU 分成两条线:Agent 时代的算力不再只拼大
Google 第八代 TPU 分成 8T 和 8I 两条线,这件事比单纯“新芯片更强”有意思。 过去讨论 AI 算力,大家很容易只看峰值、参数、集群规模。到了 Agent 时代,负载变复杂了:有长时间训练,有大规模推理,有低延迟交互,有多轮工具调用,还有大量上下文读写。所有任务都用同一种算力形态硬扛,成本会很难看。 #
作者:Administrator
发布时间:2026-04-29
分类:
AI观察
标签:
#
AI
OpenAI 上 AWS:模型独家时代开始松动了
OpenAI 模型、Codex 和 Managed Agents 进入 AWS,表面看是一次渠道扩展;往深一点看,这是 AI 云生态的一次松动。 过去两年,大模型公司和云厂商的关系很像“强绑定”:谁投钱、谁给算力、谁拿优先分发权。企业采购时也被这种绑定影响,想用某个模型,往往要进入某个云的生态。 现在 OpenAI 出
作者:Administrator
发布时间:2026-04-29
分类:
AI观察
标签:
#
AI
Sentrux:AI 写代码不能只看 diff,还要有架构传感器
AI Agent 写代码最容易让人上头。头几天,功能像开闸一样往外冒;再过几天,项目里开始出现幻觉函数、错位依赖、循环引用、God 文件。不是模型突然变笨了,而是代码库本身开始失去结构。 Sentrux 值得看的地方,不是又多了一个静态分析工具,而是它试图给 Coding Agent 补一个反馈器官:在 Agent 动
作者:Administrator
发布时间:2026-04-29
分类:
AI观察
标签:
#
AI
YourMemory:Agent 记忆不是越多越好,还要会遗忘
Agent 记忆经常被说成“越多越好”。这话只对了一半。记得越多,确实更像一个长期助手;但如果旧事实、错误偏好、过期项目状态一直留着,Agent 也会被记忆带偏。 `YourMemory` 有意思的地方,是它把“遗忘”也放进了 Agent 记忆系统。 仓库地址:sachitrafa/YourMemory ## 记忆不是
作者:Administrator
发布时间:2026-04-29
分类:
AI观察
标签:
#
AI
Databricks AI Dev Kit:让 Coding Agent 真懂你的湖仓平台
让 Coding Agent 写普通 Web 代码已经不新鲜了。难的是让它进入一个复杂数据平台:Spark、Unity Catalog、Jobs、MLflow、Model Serving、权限、表结构、流水线规范全都在场。 `Databricks AI Dev Kit` 解决的是这个问题:给 Claude Code、C
作者:Administrator
发布时间:2026-04-29
分类:
AI观察
标签:
#
AI
Xyne:企业搜索别再让 Agent 翻聊天记录
企业里最浪费时间的动作,可能是找东西。文件在 Drive,决策在 Slack,需求在 Jira,线索在邮件,代码在 GitHub,最后每个人脑子里还有一份“只有我知道”的隐性地图。 `Xyne` 盯上的正是这个问题:给工作场景做一个开源的 AI 搜索与问答引擎。 仓库地址:xynehq/xyne ## 它不是普通知识库
作者:Administrator
发布时间:2026-04-29
分类:
AI观察
标签:
#
AI
Vibe Coding 冲进原型设计,设计师真正该守住的是判断
Vibe Coding 正在把原型设计这件事压得很扁。 以前一个交互原型,可能要设计师画半天、调两天、改三轮。现在你对着 Figma Make、Framer AI、Google Stitch 或类似工具说几句话,一个能点、能跳、能演示的版本就出来了。别管它是不是最终稿,至少老板、产品、开发都能先看见东西。 这对原型设计
作者:Administrator
发布时间:2026-04-29
分类:
AI观察
标签:
#
AI
Lunel:手机不是跑代码的机器,而是 AI Coding 的遥控台
手机上写代码这件事,听起来一直有点别扭。屏幕小、键盘慢、上下文看不全,真让人把一台手机当开发机,多少有点遭罪。 `Lunel` 的有趣之处在于,它没有把手机伪装成开发机,而是把手机变成 AI Coding 的遥控台。 仓库地址:lunel-dev/lunel ## 三层架构,比远程桌面克制 Lunel 大致分三层:移动
作者:Administrator
发布时间:2026-04-29
分类:
AI观察
标签:
#
AI
共 43 篇文章
1
2
3
4
5
页