T
traeai
登录

概念

LLM

别名:大语言模型

大型语言模型,用于生成文本。

相关材料

已收录 30 条与 LLM 相关的内容,按评分排序。

Enterprise Document Intelligence: A Series on Building RAG Brick by Brick, from Minimal to Corpus scale

企业文档智能:从最小到语料库规模逐砖构建RAG系列

Towards Data Science5486 字 (约 22 分钟)
92

企业级RAG系统应聚焦文档理解与业务逻辑,而非堆叠模型和框架。简单的Python脚本往往比复杂生产系统更有效。

入选理由:多数企业RAG部署效果不佳,因基础解析和检索质量差。

精选文章#RAG#企业AI#文档智能#检索增强生成#LLM应用英文
Stop upgrading your LLM. Start fixing your data.

停止升级你的LLM,开始修复你的数据

Gradient Flow1389 字 (约 6 分钟)
87

企业部署AI智能体遇阻主因在数据整合质量而非模型能力升级,解决数据问题与组织流程重塑是成功关键。

入选理由:AI智能体部署失败中25%以上可归因于关键知识未实现系统化捕获与整理。

精选文章#AI智能体#企业AI#数据质量#系统集成#组织变革英文
Towards Data Science 图标

Proxy-Pointer RAG:解决大规模知识图谱中的实体与关系蔓延问题

Towards Data Science3847 字 (约 16 分钟)
87

Proxy-Pointer RAG 通过保留文档结构上下文,将知识图谱实体与关系匹配的计算成本降低 90% 以上,实现高效、低延迟的图谱入管,解决了大规模知识图谱的语义蔓延问题。

入选理由:Proxy-Pointer RAG 使用 Skeleton Tree 和 Breadcrumb Injection 技术,使向量检索能精准定位文档完整结构段,而非碎片化块。

精选文章#RAG#知识图谱#Proxy-Pointer#实体消歧#向量检索英文
The Statistics of Token Selection: Logits, Temperature, and Top-P Walkthrough

The Statistics of Token Selection: Logits, Temperature, and Top-P Walkthrough

Machine Learning Mastery1015 字 (约 5 分钟)
85

文章介绍了大语言模型(LLM)中的token选择机制,包括logits、temperature和top-p的原理及其在输出生成中的作用。

入选理由:logits是模型输出的原始未归一化分数,通过softmax转换为概率分布。

精选文章#LLM#logits#temperature#top-p#token selection英文
Most AI Agents Fail in Production Because They’re Built Backwards

Most AI Agents Fail in Production Because They’re Built Backwards

Towards Data Science1907 字 (约 8 分钟)
85

大多数AI代理在生产环境中失败是因为它们的架构设计不当,而不是能力不足。正确的架构应该将决策层和编排层分开,而不是让单一模型承担所有任务。

入选理由:AI代理失败的原因在于架构设计不当,而非能力不足。

精选文章#AI代理#架构设计#生产环境中文
Fragments: May 27

Fragments: May 27

Martin Fowler1806 字 (约 8 分钟)
85

Martin Fowler 在 GOTO 领导者峰会上讨论了 LLM-augmented 编程的经验,包括 Kent Beck 和 Ian Johnson 的案例研究。

入选理由:LLM-augmented 编程需要谨慎管理,避免过度依赖。

精选文章#LLM#编程#重构#政府政策#认知负荷中文
微软发布终端原生 Web Agent 框架:Webwright
https://t.co/yV6p876par

核心设计:代码即动作
传统网页智能体采用"观察→预测下一步点击→执行"的循环,每一步都...

微软发布终端原生 Web Agent 框架:Webwright

meng shao(@shao__meng)567 字 (约 3 分钟)
85

微软发布了终端原生 Web Agent 框架 Webwright,采用“代码即动作”设计,让 LLM 写 Playwright 脚本,性能表现优异,适用于多种后端平台。

入选理由:Webwright 使用 LLM 写 Playwright 脚本,将网页操作变成可运行的 Python 程序。

精选推文#Webwright#Microsoft#LLM#Playwright#自动化中文
Hacker News Best 图标

Using AI to write better code more slowly

Hacker News Best833 字 (约 4 分钟)
85

使用AI编写高质量代码虽然速度较慢,但通过多模型审查可以有效发现并修复大量错误,提升代码库的整体健康状况。

入选理由:AI可以有效发现代码中的大量错误。

精选文章#AI#代码审查#高质量代码中文
Astral Codex Ten 图标

新范式救不了你

Astral Codex Ten28012 字 (约 113 分钟)
85

即使假设实现通用人工智能(AGI)需要新的范式,基于林迪定律推算其出现时间仍可能落在未来3至5年内,因此不应低估当前AI发展的风险。

入选理由:前沿AI系统很可能继续沿用神经网络和深度学习架构,因为大脑本身就是一种神经网络。

精选文章#AGI#LLM#AI安全#深度学习#范式转换英文
Simon Willison's Weblog 图标

Datasette Agent

Simon Willison's Weblog646 字 (约 3 分钟)
85

Datasette Agent是首个结合LLM与Datasette的AI助手,支持通过对话查询数据并生成图表,基于Gemini 3.1 Flash-Lite模型运行,提供插件扩展能力。

入选理由:Datasette Agent通过Gemini 3.1 Flash-Lite模型实现低成本快速SQL查询,支持对话式数据检索

精选文章#Datasette#LLM#AI助手#SQLite#Gemini英文
Your Coding Agent Should Do AI System Engineering — Ben Burtenshaw, Hugging Face

Your Coding Agent Should Do AI System Engineering

AI Engineer4747 字 (约 19 分钟)
85

本文提出AI系统工程应由编码代理处理,通过三个渐进步骤解决硬件优化、模型训练和自动化研究,强调标准化仓库和Hugging Face Hub的重要性。

入选理由:编码代理能有效编写优化的CUDA内核,提升推理速度达30%-50%(如AMD hackathon案例)

精选视频#AI系统工程#CUDA#Hugging Face#LLM#多代理系统英文
在 Codex/Claude Code 等 Coding Agents 领域,文字是主要的输入输出方式;而在更广泛的通用 Agents 领域,特别是陪伴、实时交互等 Agents 方面,实时语音交互非...

构建Voice Agent需结合ASR、VOD、TTS、LLM及WebRTC,Agora Skills可快速集成实现低延迟实时语音交互,响应仅1秒。

入选理由:使用Agora Skills可在2-3分钟内安装并集成RTC、RTM等组件,支持快速开发Voice Agent

精选推文#Voice Agent#Agora Skills#WebRTC#LLM#实时交互中文
Fine-tuning used to mean a team, a GPU cluster, and weeks of iteration.

Now it's just a CLI command...

Fine-tuning used to mean a team, a GPU cluster, and weeks of iteration.

Fireworks AI(@FireworksAI_HQ)167 字 (约 1 分钟)
85

Fireworks AI指出,模型微调现在只需CLI命令、10分钟GPU时间和几美分,且可完全拥有权重,预训练模型虽已足够使用,但需进一步优化。

入选理由:模型微调时间从数周团队协作缩短到10分钟GPU计算,成本仅需几美分

精选推文#Fireworks AI#模型微调#LLM#CLI#GPU优化英文
Martin Fowler 图标

Bliki: Vibe Coding

Martin Fowler814 字 (约 4 分钟)
82

Vibe coding通过完全不查看LLM生成的代码来构建软件应用,仅通过提示和反馈进行开发,但存在维护性、正确性和安全性风险。该技术适合无编程知识人员创建一次性应用,但不适合生产环境使用。

入选理由:Vibe coding指完全不看代码,仅通过提示LLM来构建软件的技术

精选文章#Vibe Coding#LLM#Software Development#Security英文
AI Dev 26 x SF | Ashwyn Sharma: Every App Needs a Voice UI. Here's How to Build It

Vocal Bridge提供全托管语音AI平台,通过三个接口(应用集成、AI代理语音化、多模态工具)简化语音UI开发,将原本数月的开发周期缩短至几周。

入选理由:使用Vocal Bridge SDK可将语音AI开发时间从数月缩短至几周

精选视频#语音AI#Vocal Bridge#多模态交互#前端开发英文
Scaling the Next Paradigm of Heterogeneous Intelligence — Adrian Bertagnoli, Callosum

扩展异构智能的新范式

AI Engineer2811 字 (约 12 分钟)
78

异构智能是未来AI发展的关键范式,通过融合不同架构、规模和硬件的模型协同工作,提升复杂问题解决效率。

入选理由:当前AI发展正从同质化向异构化演进,如Mixture of Experts和多代理系统已初现端倪。

精选视频#AI#异构计算#多代理系统#模型架构#硬件加速英文
AI Dev 26 x SF | Andi Partovi: Why Every Agent Needs a Simulation Sandbox

AI Dev 26 x SF | Andi Partovi:为何每个代理都需要模拟沙盒

DeepLearning.AI3307 字 (约 14 分钟)
78

AI代理具备非确定性与交互性,传统测试方法失效,必须通过模拟沙盒进行大规模重复与交互式验证,以确保生产前行为鲁棒。

入选理由:AI代理具有非确定性(同一输入可得不同输出),测试需在模拟沙盒中大规模重复执行以覆盖行为分布。

精选视频#AI代理#模拟沙盒#测试#LLM运维#自主系统英文
LLM Themes Are Not Observations

LLM主题标签不是观测值

Towards Data Science3035 字 (约 13 分钟)
78

LLM生成的主题标签不是真实观测值,而是条件生成过程的输出,存在选择偏差、时间偏差、测量偏差和角色偏差四大问题,会导致下游因果分析产生误导性结果。

入选理由:LLM生成变量存在四个偏差:选择偏差、时间偏差、测量偏差和角色偏差

精选文章#LLM#数据分析#因果推断#机器学习英文
Custom LLM and browser harness = SOTA web agent

Custom LLM and browser harness = SOTA web agent

Browser Use(@browser_use)84 字 (约 1 分钟)
75

介绍了一个名为 Browser Use Terminal 的项目,结合 Rust 和 TUI 在浏览器中实现高效工作,利用 LLM 提供自由度。

入选理由:Browser Use Terminal 使用 Rust 和 TUI 在浏览器中实现高效工作。

精选推文#Rust#TUI#LLM#浏览器控制#效率提升中文
We shipped a terminal UI and harness written in Rust🔥

> no frameworks
> full power of browse...

我们发布了用 Rust 编写的终端 UI 和浏览器控制框架🔥

Browser Use(@browser_use)143 字 (约 1 分钟)
75

Browser Use 发布基于 Rust 构建的终端界面与浏览器控制框架,支持任意 LLM 接入并实现原生 Chrome 控制。

入选理由:使用 Rust 编写的终端 UI 和浏览器控制框架,无外部框架依赖。

精选推文#Rust#TUI#LLM#浏览器自动化#ratatui英文
The a16z Show 图标

Hugging Face 首席执行官 Clem Delangue 探讨开源 AI 地图、大语言模型泡沫及消费机器人未来。

入选理由:API-based LLMs are overvalued compared to open-weight models.

精选播客#AI#开源#大语言模型#Hugging Face#机器人英文
Hacker News Best 图标

永恒的懒惰九月

Hacker News Best918 字 (约 4 分钟)
72

作者认为AI代理在软件开发中的应用将是一大失误,因其无法真正编程,只能模拟代码分布。

入选理由:AI代理不能真正编程,仅能模仿代码分布,输出质量差且不易识别

精选文章#AI#软件开发#编程#LLM#技术批判英文
Browser-use 团队用 Rust 编写的终端 TUI 工具,你用自然语言告诉它做什么,它就去控制浏览器完成。自研的 LLM 引擎加上 Chrome 的 CDP 协议,支持用你登录态的 Chro...

Browser-use 团队开源了一款基于 Rust 的终端 TUI 工具,可通过自然语言控制浏览器操作,结合自研 LLM 引擎与 Chrome DevTools Protocol 实现自动化。

入选理由:该工具使用 Rust 编写,具备高性能和内存安全特性。

精选推文#Rust#TUI#LLM#Chrome DevTools Protocol#自动化测试中文
北大提出首个可验证的仓库级生成基准RepoZero,评测LLM能否从0生成一个代码仓库

北大提出RepoZero,首个可验证的仓库级生成基准,用于评估LLM从零生成完整代码仓库的能力,揭示当前模型在复杂代码结构生成上的局限性。

入选理由:RepoZero通过功能完整性、代码质量、文档一致性等12项指标,量化评估LLM生成代码仓库的可行性

精选文章#代码生成#LLM评估#基准测试#北大中文
ESI-Bench

Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop

ESI-Bench:迈向具身空间智能与感知-行动闭环

AK(@_akhaliq)60 字 (约 1 分钟)
70

ESI-Bench 是一种新型基准测试,专注于评估具身空间智能模型在感知-行动闭环中的表现,提供比现有测试更具挑战性的场景和指标。

入选理由:ESI-Bench 采用连续 3D 轨迹预测任务,比现有基准更具挑战性

精选推文#具身智能#空间智能#AI基准测试#3D轨迹预测#感知-行动循环英文
开源的 AI 每日简报工具,聚合 23 个数据源(GitHub Trending、X 推文、AI 媒体、国际时政、财经、中文社区等),用 LLM 自动生成中文摘要。

https://t.co/RRz...

开源的 AI 每日简报工具,聚合 23 个数据源

Geek(@geekbb)133 字 (约 1 分钟)
65

一款开源的 AI 日报工具,整合 23 个数据源并用 LLM 自动生成中文摘要。

入选理由:工具整合 GitHub Trending、X 推文等 23 个数据源

精选推文#AI工具#开源项目#信息聚合#LLM应用英文
Simon Willison's Weblog 图标

llm-gemini 0.32a0

Simon Willison's Weblog196 字 (约 1 分钟)
45

llm-gemini 0.32a0 是一个支持 Google Gemini 模型的 LLM 插件,新增流式推理令牌功能,但内容仅为版本发布通知,缺乏技术深度与实践价值。

入选理由:llm-gemini 0.32a0 是一个支持 Google Gemini 模型的 LLM 插件,新增流式推理令牌功能,但内容仅为版本发布通知,缺乏技术深度与实

精选文章#llm#Gemini#plugin英文
李继刚(@lijigang_com) 图标

LLM is a

李继刚(@lijigang_com)53 字 (约 1 分钟)
30

李继刚在X平台上发起了一项关于LLM(大型语言模型)的投票,询问用户认为LLM是技术、特性还是产品,并提供了35票和22小时的投票期限。

入选理由:李继刚在X平台上发起了一项关于LLM的投票。

精选推文#LLM#投票#X平台中文
Gary Marcus(@GaryMarcus) 图标

新的数学成果是结合Lean等神经符号系统还是纯LLM?

Gary Marcus(@GaryMarcus)56 字 (约 1 分钟)
30

Gary Marcus质疑近期数学成果是否结合神经符号系统与Lean等工具,还是纯LLM驱动,但未提供具体技术细节。

入选理由:该推文仅提出技术路线疑问,未展示任何实证分析或架构细节

精选推文#神经符号AI#LLM#Lean定理证明器英文

跨材料问答 · LLM

回答基于:LLM 相关 30 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容