当前位置: 首页 > news >正文

Chroma私有化:本地部署完整方案

嵌入向量(vector embedding)是表示任何类型数据的 A.I 原生方式,使它们非常适合与各种 A.I 驱动的工具和算法一起使用。 它们可以表示文本、图像,很快还可以表示音频和视频。 有许多创建嵌入的选项,无论是在本地使用已安装的库,还是通过调用 API。

Chroma 是一个用于构建带有嵌入向量的 AI 应用程序的数据库。 它内置了入门所需的一切,并可在你的机器上运行。

部署模式 适用场景 核心优势 复杂度
单机Docker部署 开发测试、小型应用 快速启动、资源占用少
多节点集群部署 生产环境、高可用 水平扩展、负载均衡 ⭐⭐⭐
Docker单机部署方案
# 创建部署目录
mkdir -p chroma-deployment
cd chroma-deployment# 创建docker-compose.yml文件
cat > docker-compose.yml << 'EOF'
version: '3.9'networks:chroma-net:driver: bridgeservices:chroma-server:image: chromadb/chroma:latestcontainer_name: chroma-servervolumes:- chroma-data:/dataenvironment:- CHROMA_PERSIST_DIRECTORY=/dataports:- "8000:8000"restart: unless-stoppednetworks:- chroma-netvolumes:chroma-data:driver: local
EOF# 启动服务
docker-compose up -d# 验证服务状态
docker-compose logs -f
curl http://localhost:8000/api/v2/heartbeat
高级配置选项
environment:- CHROMA_PERSIST_DIRECTORY=/data- CHROMA_MAX_CONNECTIONS=100- CHROMA_WORKER_THREADS=4- CHROMA_EMBEDDING_BATCH_SIZE=32- CHROMA_INDEX_BATCH_SIZE=1000
生产环境部署架构

图片
高可用配置

# 多节点docker-compose配置示例
services:chroma-node1:image: chromadb/chroma:latestenvironment:- CHROMA_NODE_ID=node1- CHROMA_CLUSTER_MODE=true- CHROMA_PEERS=node2:8000,node3:8000networks:- chroma-clusterchroma-node2:image: chromadb/chroma:latestenvironment:- CHROMA_NODE_ID=node2- CHROMA_CLUSTER_MODE=true- CHROMA_PEERS=node1:8000,node3:8000networks:- chroma-clusterchroma-node3:image: chromadb/chroma:latestenvironment:- CHROMA_NODE_ID=node3- CHROMA_CLUSTER_MODE=true- CHROMA_PEERS=node1:8000,node2:8000networks:- chroma-cluster
监控检查配置
# 健康检查脚本
#!/bin/bash
HEARTBEAT_URL="http://localhost:8000/api/v2/heartbeat"
STATUS=$(curl -s -o /dev/null -w "%{http_code}" $HEARTBEAT_URL)if [ $STATUS -eq 200 ]; thenecho "Chroma服务正常"exit 0
elseecho "Chroma服务异常,状态码: $STATUS"exit 1
fi
http://www.hskmm.com/?act=detail&tid=30401

相关文章:

  • 嵌入式-C++面经2
  • PHP转Go系列 | 如何将 PHP 项目快速迁移到 Go 上?
  • 详细介绍:【OpenHarmony】用户文件服务模块架构
  • 详细介绍:全新 CloudPilot AI:嵌入 Kubernetes 的 SRE Agent,降本与韧性双提升!
  • “环境变量”是什么, 为什么要配置环境变量 --初学者
  • AI元人文:对大模型的召唤——未来哪吒
  • https与http区别思维拓扑图 - krt
  • Java 装饰器模式(Decorator) - krt
  • Python INI 文件读写利器 configparser
  • tcp/ip五层协议模型--思维拓扑图 - krt
  • springboot模式与应用案例--思维拓扑图 - krt
  • DAY04
  • AlexNet vs LeNet 对比实验
  • QT:获取文件信息之创建日期方法created()方法--废弃
  • 排列组合 容斥 总结
  • 10.13每日总结
  • 新学期每日总结(第7天)
  • 20232422 2025-2026-1 《网络与系统攻防技术》实验一实验报告
  • Day 9
  • 14 10.13
  • 日志|前端框架Vue
  • oop.shiyan1
  • 玄机——第一章 应急响应-Linux日志分析 wp
  • 第四周第五天4.5
  • 深入解析:flutter AudioPlayer的使用问题及处理
  • 11 10.10
  • 12 10.11
  • P3330 [ZJOI2011] 看电影
  • 20232315 2025-2026-1 《网络与系统攻防技术》实验一实验报告
  • 地址