Every millisecond matters. We’re open sourcing the tokenizer we built and deployed on production; th...
Perplexity 开源其高效的 Unigram 分词器,CPU 利用率降低 5-6 倍,显著减少延迟。
入选理由:Perplexity 开源 Unigram 分词器,CPU 利用率降低 5-6 倍。
公司
也叫:perplexity_ai
一家专注于 AI 技术的公司。
已收录 30 篇与「Perplexity」相关的 AI 资讯和分析。
Perplexity 开源其高效的 Unigram 分词器,CPU 利用率降低 5-6 倍,显著减少延迟。
入选理由:Perplexity 开源 Unigram 分词器,CPU 利用率降低 5-6 倍。
Perplexity开源了重构的Unigram分词器,CPU利用率降低5-6倍。
入选理由:Perplexity开源了Unigram分词器,CPU利用率降低5-6倍。
Perplexity 的编码器在生产输入长度下将 p50 延迟降低了约 5 倍,相比 HuggingFace 分词器,2 倍相比 SentencePiece C++,1.5 倍相比 IREE C。
入选理由:Perplexity 编码器在生产输入长度下延迟降低约 5 倍
GB 200s 提高了大型 MoE 模型如 Qwen 的预填充和解码分离效率,相比 Hopper 平台,吞吐量显著提升。
入选理由:GB 200s 在高吞吐量推理方面比 Hopper 更适合大型 MoE 模型。
Perplexity 发布了关于如何在 NVIDIA GB200 NVL72 Blackwell 机架上部署 Qwen3 235B 模型的研究,GB200 在大规模 MoE 模型的高吞吐量推理方面优于 Hopper。
入选理由:Qwen3 235B 模型在 NVIDIA GB200 上实现了高效的高吞吐量推理。
Perplexity 正在成为企业级知识与研究平台,PayPal 每周运行 74,000 项任务,用于模型验证、市场趋势分析等关键业务场景。
入选理由:PayPal 每周在 Perplexity Enterprise 上执行 74,000 个任务,覆盖核心研究流程。
Perplexity 实现默认安全的计算架构,每个任务在硬件隔离沙箱中运行,采用 VPC 级存储与计算分离,并使用短生命周期代理令牌认证 Agent。
入选理由:所有任务运行在硬件级隔离的沙箱环境中,实现强安全隔离。
企业深度采用AI工具需持续投入安全工程,Perplexity通过沙箱与自动化安全工作流实现风险控制。
入选理由:企业部署AI工具需持续投资安全工程以保障可信运行
Perplexity 开源其内部安全工具 Bumblebee,用于保护开发者系统并提升产品安全性。
入选理由:Bumblebee 最初是 Perplexity 内部开发的安全工具。
Computer 现在连接 Snowflake,可直接对实时数据运行分析任务。
入选理由:Computer 可以连接 Snowflake 数据仓库进行实时分析。
Perplexity通过构建可组合、可评估的AI代理技能体系,实现对复杂任务的自动化处理,其核心方法是将多步推理任务拆解为原子化技能模块,并基于真实用户行为数据进行持续优化。
入选理由:Perplexity将复杂任务拆解为12类原子化代理技能,如信息检索与验证。
Perplexity发布内部Agent技能手册,强调开发者需采用新思维模式来设计、优化和维护AI代理技能。
入选理由:Perplexity发布内部Agent技能手册,涵盖设计、精炼与维护全流程。
Perplexity 提出:编程中的陷阱(gotchas)并非例外,而是最高价值的知识点,揭示真实开发场景的认知盲区。
入选理由:Gotchas 是实际开发中最具价值的知识点,远超常规规则。
MiniMax Agent 集成 Perplexity 搜索基础设施,在 700 多项任务中表现最优,提升搜索质量与效率。
入选理由:Perplexity 在 MiniMax 的 700+ 任务基准测试中胜出
Perplexity 开源 Bumblebee,一款用于 macOS 和 Linux 的只读扫描工具,检测开发机上的风险包、扩展和 AI 工具配置。
入选理由:Bumblebee 是一个开源的只读安全扫描器,支持 macOS 和 Linux 平台。
Perplexity AI 宣布其系统可直接连接 Snowflake 数据仓库,实现端到端数据分析。
入选理由:Perplexity 现在支持直接连接 Snowflake 数据仓库。
Perplexity利用NVIDIA的CUTLASS Python栈优化其推理模型,显著提升大规模语言模型的性能。
入选理由:Perplexity开发了ROSE推理引擎,支持从嵌入到万亿参数LLM的模型服务。
Perplexity通过预处理过滤广告、导航和无用内容,将每片段关键信息提升63%,实现了50倍压缩率的同时保持前沿性能。
入选理由:通过过滤广告、导航、元数据和无效内容,Perplexity使关键信息密度提升63%
Perplexity 正在构建市场上最安全、可扩展的代理运行时沙箱。
入选理由:Perplexity 使用代理方式管理 API 密钥以增强安全性。
Perplexity 推出基于 Snowflake 数据的仪表盘和自动化工具,支持销售漏斗分析、产品使用情况和客户分群。
入选理由:Perplexity 支持从 Snowflake 构建数据看板和自动化流程。
PayPal 使用 Perplexity Enterprise 每周运行 74,000 任务,用于模型验证、渠道表现、市场趋势研究、竞争情报和产品分析。
入选理由:PayPal 使用 Perplexity Enterprise 每周运行 74,000 任务。
新的应用现在支持服务器端渲染并通过搜索引擎和像 ChatGPT、Claude 和 Perplexity 这样的 AI 搜索引擎被发现。现有的应用将进行预渲染。
入选理由:应用现在支持服务器端渲染并可搜索。
Perplexity推出Mac应用,Personal Computer功能增强,支持本地文件和网络任务处理。
入选理由:Personal Computer是Perplexity的高级版本,适用于所有Mac用户。
Perplexity 的 AI 代理在执行前并行扫描外部内容,采用 ML 分类器和 BrowseSafe 模型保障安全,文件数据加密且7天后自动删除。
入选理由:外部内容通过 ML 分类器与 BrowseSafe 模型并行扫描以提升安全性。
开发者现可通过一次调用获取授权金融数据、实时市场行情和引用来源,适用于需要当前、可验证财务答案的 AI 代理。
入选理由:Finance Search 可通过单次工具调用获取多种金融信息。
推文借Python之禅调侃AI模型对简单知识的掌握,暗示易懂内容应被删除,信息密度低。
入选理由:‘如果实现容易解释,可能是好主意’源自Python之禅
多家知名科技公司在其员工通过推特分享他们的项目进展,这种做法值得更多公司效仿。
入选理由:Anthropic、OpenAI、Shopify、Stripe、Notion、Cursor、xAI、Perplexity 和 Figma 的员工在推特上分享他们的项目进展。
Perplexity正在向早期测试者推出其代理网络浏览器Comet,但文章信息量有限。
入选理由:Perplexity推出了名为Comet的代理浏览器。
Perplexity即将推出新的Mac应用程序,并将在未来几周内弃用旧版。
入选理由:新Perplexity Mac应用现已可下载,提供个人电脑功能。
Perplexity 提供了关于改进 Unigram 分词器 CPU 性能的博客文章链接。
入选理由:Perplexity 提供了改进 Unigram 分词器性能的博客文章。
与「Perplexity」经常一起出现的 AI 术语。
💡 想追踪「Perplexity」的长期趋势?去 实体雷达 · Perplexity 查看详细分析和跨材料问答。