brpc(1)—bthread和brpc

2025-07-06

brpc 是百度开源的一个网络框架, 它几乎是开源的C++高性能网络框架的唯一选择。它是国内C++最优秀的开源作品之一，我相信国内大厂内部的闭源RPC网络库也参考过它

brpc的重要特性

bthread，这是几乎唯一的工业级开源协程库（虽然作者不认为它是协程）,在开源界几乎没有替代品
标准的rpc框架和接口, 四参数service接口
(google::protobuf::RpcController* cntl_base,
const Request* request,
Response* response,
google::protobuf::Closure* done)

终结了rpc 各种各样的自定义调用接口问题，以后开发rpc默认使用这种接口，
3. 完备的可观测性；logging和trace, span; bvar 支持的监控指标

阅读全文

计算(2)——GPU计算和大模型

2025-05-03

前面提到，CPU运算的瓶颈往往不在于计算，而在于内存、存储和网络。相比于设计算法模型，CPU计算更侧重于工程。

相比下，GPU运算才是真正的高性能运算，虽然它的瓶颈同样可能来自GPU、显存、存储和网络，但提高计算能力、设计优秀的算法、编写高性能低开销的算子，是GPU运算的核心。GPU运算的典型场景就是大模型。

阅读全文

计算(1)——CPU计算和大数据

2025-04-27

由于本人是存储方向，前面的文章大多数是关于存储的。计算机系统=计算+存储，其中计算包括计算单元（CPU、GPU）、cacheline和内存态的处理, 而存储特指IO处理。计算可分为CPU计算和GPU计算两部分，前者的典型场景是操作系统处理、进程执行、互联网业务处理和大数据和OLAP处理等。后者的典型场景是大模型的训练推理。

本文介绍CPU计算。CPU计算主要包括业务处理和大数据处理两部分，CPU运算的瓶颈往往不在于计算，而在于内存、存储和网络（可能这是ddia 把大数据计算也放到内的原因）。相比于算法模型，CPU计算更侧重于工程。

阅读全文

编程语言——C++右值和右值引用

2025-04-22

C++右值和右值引用是最容易用错的特性之一，相关教程普遍写得不清晰。实际上，只有在所有权转移时才需要使用右值引用，移动语义移动的是所有权，完美转发转发的也是所有权。

总结

先放总结

左值引用的语义是绑定、const指针和不转移所有权(rust称为借用)，右值引用的语义是绑定、const指针和转移所有权
是否使用右值引用，取决于是否要转移变量所有权。右值引用和左值引用在传参时都不会调用构造函数，性能一样高效。
如果是字面量, 如果只是读字面量，直接用const& 参数接收即可 （最常见）。如果要转移所有权，例如使用容器时，字面值在当前函数创建随即交给容器，字面量的生命周期后续由容器负责。这时候容器函数应该使用&&，例如emplace()的接口就是右值引用。const&和&&的开销都是一次字面量的构造函数
如果是左值，如果需要转移对象所有权，推荐使用&&和std::move()。如果不要, 用左值引用或指针即可。是不是要转移所有权，在于你想要这个左值变量在当前函数析构，还是在函数外析构
新建对象，通过传std::move()左值，可以通过移动构造加快构造速度。如果传字面量，通过可以通过移动构造加快速度。但如果传左值，则需要调用拷贝构造函数。
函数返回值不要考虑右值引用，右值引用只在函数参数上使用

阅读全文

编程语言——C++协程和高性能编程

2025-04-20

C++可以写出性能高效的程序，一个原因来自语言本身的因素，例如

C++程序编译器可以进行优化，编译直接得到机器码，这让编译后需要执行的指令更少（解释器性能比编译期差的主要原因就是是解释器单行编译执行，而编译器是文件编译执行，获得的信息更多，优化空间更大。明确的类型信息也让编译期获得内存信息，可以在无须创建对象情况下进行优化）
没有虚函数的C++程序编译后的执行码和C语言一样，没有golang interface{}, java 虚函数等额外的内存开销。C++的class, template等功能抽象不会带来额外的性能开销
C++可以直接管理内存，轻松写出内存零拷贝的程序，无需GC额外的性能开销。

除了语言本身的因素，生态因素对于高性能同样重要。用户程序不可能每次都造轮子，如果没有高性能的库，C++不会成为性能高效程序的首选。例如Python语言的性能虽然差，但python有tensorflow, pytorch等高性能神经网络框架，这让python写出的神经网络性能同样高效。

dpdk和spdk工具链让C++开发高性能网络服务器和高性能存储服务变得容易，GPU等新硬件和cuda等生态让C++成为高性能计算的基础。C++20提供了协程支持，deepseek 开源的3FS 就是C++20高性能编程的典型例子。

阅读全文