T
traeai
RSS登录

traeai 主题雷达

向量数据库、Embedding 与语义搜索实践

追踪 Qdrant、Milvus、pgvector、Embedding、稀疏检索、重排与语义搜索系统设计。

搜索用户通常想解决什么

想理解向量数据库怎么选型、怎么做语义搜索,以及 RAG 检索链路如何优化。

为什么值得持续追踪

很多 AI 应用的效果瓶颈不在模型,而在检索和上下文组织。

向量数据库vector databaseEmbedding语义搜索QdrantMilvuspgvectorrerank

精选内容

按相关度、评分和更新时间筛出的可读内容。

搜索更多
Power video semantic search with Amazon Nova Multimodal Embeddings

Power video semantic search with Amazon Nova Multimodal Embeddings

AWS Machine Learning Blog3566 字 (约 15 分钟)
87

AWS 推出基于 Amazon Nova 多模态嵌入的视频语义搜索方案,可联合处理音视频、文本等多源信号,提升检索准确性与效率。

入选理由:传统视频搜索依赖文本转录,易丢失时空和音频信息

精选文章#Amazon Nova#多模态嵌入#视频语义搜索#Amazon Bedrock#AWS英文
Modern Sparse Neural Retrieval: From Theory to Practice

Modern Sparse Neural Retrieval: From Theory to Practice

Qdrant5415 字 (约 22 分钟)
87

文章系统解析现代稀疏神经检索模型(如SPLADE++),对比关键词与稠密检索优劣,并展示其在Qdrant中的实践应用。

入选理由:稀疏神经检索结合BM25的可解释性与语义理解能力,优于传统关键词匹配

精选文章#稀疏神经检索#SPLADE#Qdrant#信息检索#向量搜索英文
Training and Finetuning Multimodal Embedding & Reranker Models with Sentence Transformers

文章详解如何使用 Sentence Transformers 微调多模态嵌入与重排序模型,并以视觉文档检索任务为例展示显著性能提升。

入选理由:微调多模态嵌入模型可显著提升特定任务(如视觉文档检索)的检索效果

精选文章#Sentence Transformers#多模态学习#模型微调#嵌入模型#Hugging Face英文
Weaviate • vector database(@weaviate_io) 图标

We spent weeks testing text vs. image retrieval for RAG. The winner? 𝗡𝗲𝗶𝘁𝗵𝗲𝗿. Our recent pu...

Weaviate • vector database(@weaviate_io)260 字 (约 2 分钟)
85

Weaviate测试文本与图像检索在RAG中的效果,发现两者各有优劣,多模态混合检索表现最佳。

入选理由:文本检索在Recall@1略优于图像,但图像在深层召回中表现相当甚至更好。

精选推文#RAG#多模态检索#向量数据库#Weaviate#信息检索英文
Hugging Face Blog 图标

Multimodal Embedding & Reranker Models with Sentence Transformers

Hugging Face Blog123 字 (约 1 分钟)
85

sentence-transformers v5.4 新增多模态支持,可将文本、图像、音频和视频映射至统一向量空间,实现跨模态相似度计算。 多模态 Reranker 模型支持对混合模态文档对进行相关性打分,可直接用于构建跨模态检索与多模态 RAG 流水线。 使用多模态功能需按需安装依赖,且 VLM 类模型对 GPU 显存有明确要求(2B 约 8GB,8B 约 20GB),CPU 推理极慢。

入选理由:sentence-transformers v5.4 新增多模态支持,可将文本、图像、音频和视频映射至统一向量空间,实现跨模态相似度计算。

精选文章#Sentence Transformers#多模态检索#向量嵌入#RAG#Hugging Face中文
𝗠𝗶𝗹𝘃𝘂𝘀 𝗳𝗶𝘅𝗲𝘀 𝗮𝗴𝗲𝗻𝘁 𝗺𝗲𝗺𝗼𝗿𝘆, 𝗲𝘃𝗲𝗻 𝗮𝗳𝘁𝗲𝗿 𝗔𝗻𝘁𝗵𝗿𝗼𝗽𝗶𝗰'𝘀 ...

Milvus通过语义搜索解决了Anthropic托管代理的记忆召回问题,提升了任务恢复和事件检索效率。

入选理由:托管代理的会话日志无法按语义检索,限制了事件回顾能力。

精选推文#Milvus#Anthropic#AI代理#语义搜索英文
Optimize video semantic search intent with Amazon Nova Model Distillation on Amazon Bedrock

Optimize video semantic search intent with Amazon Nova Model Distillation on Amazon Bedrock

AWS Machine Learning Blog2173 字 (约 9 分钟)
82

AWS 使用模型蒸馏技术将大模型的路由智能迁移到小模型,在视频语义搜索中降低95%成本、50%延迟,同时保持准确率。

入选理由:模型蒸馏无需人工标注数据,利用教师模型自动生成高质量训练样本

精选文章#Amazon Bedrock#模型蒸馏#视频语义搜索#多模态AI#AWS英文
What is Vector Quantization?

What is Vector Quantization?

Qdrant3292 字 (约 14 分钟)
82

向量量化通过压缩高维向量(如OpenAI嵌入)显著降低内存占用和搜索成本,Qdrant支持标量、乘积和二值化三种主要方法。

入选理由:1536维float32向量占6KB,百万级数据需GB级内存,量化可大幅压缩存储

精选文章#向量量化#Qdrant#HNSW#嵌入压缩#近似最近邻搜索英文
What is a Vector Database?

What is a Vector Database?

Qdrant4408 字 (约 18 分钟)
82

向量数据库专为高效处理高维向量数据而设计,支持基于语义相似性的检索,适用于推荐系统、RAG等AI场景。

入选理由:向量数据库专用于存储和检索高维向量,支持语义相似性搜索

精选文章#向量数据库#AI#非结构化数据#相似性搜索#Qdrant英文
Distance-based data exploration

Distance-based data exploration

Qdrant1488 字 (约 6 分钟)
82

Qdrant 新增 Distance Matrix API,支持高效计算高维数据距离矩阵,结合 UMAP 实现直观的无监督数据探索。

入选理由:Qdrant 1.12 引入 Distance Matrix API,避免重复计算,提升相似性分析效率

精选文章#Qdrant#向量数据库#UMAP#数据可视化#相似性搜索英文
Production-ready legal AI within 24 hours.

Here's the technical breakdown of how we did it for our ...

Production-ready legal AI within 24 hours. Here's the technical breakdown of how we did it for our ...

Weaviate • vector database(@weaviate_io)412 字 (约 2 分钟)
78

Weaviate 团队利用其 Query Agent 在 24 小时内构建了可投入生产的法律 AI 助手,支持精准检索与引用溯源。

入选理由:Query Agent 将数据库视为工具集,能自动构造带过滤的结构化查询并生成带引用的回答。

精选推文#Weaviate#RAG#向量数据库#AI Agent#法律科技英文
Everyone thinks prompt engineering is just "being nice to ChatGPT".

There’s more to it than that.

...

Everyone thinks prompt engineering is just "being nice to ChatGPT". There’s more to it than that. ...

Weaviate • vector database(@weaviate_io)339 字 (约 2 分钟)
78

Prompt engineering远不止“对ChatGPT友好”,核心技巧包括CoT、Few-shot、ToT和ReAct,组合使用可显著提升LLM表现。

入选理由:Chain of Thought通过分步推理提升复杂任务准确性

精选推文#Prompt Engineering#LLM#AI#RAG#Weaviate英文

相关主题