投稿
![[07cf09d432524716b483015d9a24cc6a.png]] Milvus x 智能客服 :从“找对商品”到“答对细节”的检索体系升级我们熠坤AI初创公司推出的基于⼤模型RPA 和 RAG 技术的智能客服系统,⽀持淘宝、京东、拼多多等 5+ 电商平台,并已接入头部领域店铺,旨在帮助客服自动回复客户的各种问题。 在早期版本中,我们的系统完全采用 Ragflow 架构,通过将商品的全部内容直接进行粗放式切片(Chunk)处理。但随着接入店铺数据量的增长和咨询场景的复杂化,该架构暴露出了严重的工程与业务痛点: 一方面,检索粒度完全不可控,导致大量无关噪音混入上下文;另一方面,Ragflow系统本身日益臃肿,维护难度大,系统脆弱性增加。 于是在经过大量的调研与测试以后,我们将语义搜索的向量数据库迁移到了milvus,与postgre传统数据库的精确匹配形成互补。 1. 核心需求拆解我们在落地智能客服 RAG 的过程中,最核心的挑战集中在五类: 对象定位难...
GPU
Programming Massively Parallel Processors》(大规模并行处理器编程实战) 会写Kernel函数。 懂得如何利用 Shared Memory 减少显存访问。 理解 Thread Warp Divergence(线程束分歧)怎么拖慢速度。 基本线性代数运算库 (BLAS):简单的矩阵乘法(GEMM),先用CPU写三层循环,再用AVX优化,最后用CUDA搬到GPU上优化。
Modern C++
右值引用、智能指针、RAII、模板元编程。内存管理(堆vs栈)、指针的本质、STL容器的底层实现。《C++ Primer》(当字典查)、《Effective Modern C++》。
计算机体系结构
《CSAPP》Cache Hit/Miss、流水线(Pipeline)、SIMD指令集(AVX/Neon)大模型本质上就是巨大的矩阵乘法,不懂内存和算力调度,一切优化都是空谈。
未命名
把FP32(32位浮点)变成FP16甚至INT8(8位整数)运行,且精度损失不大。Post-Training Quantization (PTQ)。了解对称/非对称量化。 找一个开源的ResNet或者简单的Transformer模型,把它导出为ONNX格式,然后用TensorRT加速推理。记录加速前后的Latency(延迟)和Throughput(吞吐量)。 把CUDA代码迁移到Ascend上,踩过哪些坑,最后怎么解决的
数据库系统
数据库结构type->schema Relation Modelrelation关系是n元组tuple的集合(无次序)relation is a set of tupleattribute->domain(NULL存在于所有domain,表示不存在或者不确定的)每个元素都是原子的关系用一个表来表示元组用行来表示 key唯一区分tuple的superkeycandidate key,最小的superkeyprimary key,被选出作为参考的candidate keyforeign key 是另外表里的主键,为什么要有外键,用来找到另一张表的数据,相当于引用。 模式图relation query language关系代数(函数式查询语言)基本操作:select横向选择project纵向选择,投影Πunion:集合做∪set difference:-cartesian product笛卡尔积rename非基本操作:set intersecionnatural join自然连接:公共属性相等的行连接在一起theta...
清理C盘及wsl
使用 du 命令查看目录占用空间du(Disk Usage)命令可以帮助你查看文件和目录的磁盘使用情况。 查看当前目录及其子目录的空间占用:du -h --max-depth=1这个命令会显示当前目录和每个子目录的空间占用情况。-h 参数会将大小显示为人类可读的格式(例如 KB、MB、GB),–max-depth=1 会限制显示到第一层目录。 查看特定目录的空间占用:du -sh /path/to/directory其中 -s 会显示目录的总占用情况,-h 为人类可读格式。 查看整个文件系统的磁盘占用情况:du -h / --max-depth=1 du -h --max-depth=1 --exclude=mnt/c这将会显示 /c 目录下每个子目录的大小,并且排除了 mnt 目录。 123456789101112131415161718192021222324252627288.0K ./Docker4.0K ./media968K ./run6.3M ./etcdu: WARNING: Circular directory...
图书管理系统
mysql的登陆设置 mysql数据类型数值类型(Numeric Types)1.1 整数类型数据类型 存储大小 范围(有符号) 范围(无符号) 说明TINYINT 1 字节 -128 ~ 127 0 ~ 255 适合小范围整数SMALLINT 2 字节 -32,768 ~ 32,767 0 ~ 65,535 适用于较小整数MEDIUMINT 3 字节 -8,388,608 ~ 8,388,607 0 ~ 16,777,215 中等大小整数INT(INTEGER) 4 字节 -2,147,483,648 ~ 2,147,483,647 0 ~ 4,294,967,295 常用整数类型BIGINT 8 字节 -9,223,372,036,854,775,808 ~ 9,223,372,036,854,775,807 0 ~ 18,446,744,073,709,551,615 超大整数补充: UNSIGNED(无符号):移除负数,使正数范围翻倍。ZEROFILL:前导零填充(不推荐,已废弃)。1.2 浮点类型数据类型 存储大小 说明FLOAT(M, D) 4...
科学上网配置
1. 透明代理/系统代理实现方式选项system proxyredirecttproxygvisor tunsystem tun 推荐tproxy 或 system tun 原因tproxy:支持透明代理,可处理 UDP 流量(如游戏、视频通话),需 Root/管理员权限。 system tun:系统级虚拟网卡模式,兼容性更好,适合全局代理(无需应用单独配置)。 不推荐 system proxy:仅修改系统代理设置,部分应用(如 UWP、命令行工具)可能绕过。 分流模式选项 推荐值 场景大陆白名单模式GFWList模式不进行分流 GFWList模式GFWList模式:仅代理被墙的域名/IP,国内流量直连,更精准且节省代理流量。 备选:大陆白名单模式:适合需要严格隔离国内外流量的场景(如企业网络),但需依赖完善的国内IP库。 避免使用 不进行分流:所有流量走代理,可能影响国内服务速度。 防止DNS污染选项 推荐值 说明关闭仅防止DNS劫持转发DNS请求DoH DoHDoH (DNS-over-HTTPS):加密 DNS...
网络是怎样连接的
传递信息:在进行收发数据操作之前,双方需要先建立起这条管道才行。建立管道的关键在于管道两端的数据出入口,这些出入口称为套接字。我们需要先创建套接字,然后再将套接字连接起来形成管道。实际的过程是下面这样的。首先,服务器一方先创建套接字,然后等待客户端向该套接字连接管道 A。当服务器进入等待状态时,客户端就可以连接管道了。具体来说,客户端也会先创建一个套接字,然后从该套接字延伸出管道,最后管道连接到服务器端的套接字上。当双方的套接字连接起来之后,通信准备就完成了。接下来,就像我们刚刚讲过的一样,只要将数据送入套接字就可以收发数据了。我们再来看一看收发数据操作结束时的情形。当数据全部发送完毕之后,连接的管道将会被断开。管道在连接时是由客户端发起的,但在断开时可以由客户端或服务器任意一方发起 A。其中一方断开后,另一方也会随之断开,当管道断开后,套接字也会被删除。到此为止,通信操作就结束了。综上所述,收发数据的操作分为若干个阶段,可以大致总结为以下 4...

