2023

11-17 大模型推理 - Prefix Caching加速
10-10 大模型推理 - FasterTransformer调试技巧
09-17 带新人切忌“太好心”
09-02 大模型推理 - Continuous batching和FasterTransformer结合
06-19 大模型推理 - GPTQ 落地与优化
04-26 大模型推理 - GPTQ 量化过程解析

2022

12-03 读《火种》
09-17 读《武岭梦残》
08-03 读《李宗仁回忆录》
04-11 《Rust in Action》读书笔记
04-08 《Effective Modern C++》读书笔记
03-22 Kubernetes三种探针的使用场景
03-19 Rust初体验
03-13 Prometheus监控系统总结
03-01 多架构镜像的构建
02-13 21年春节杂记
01-05 2021年工作总结

2021

12-03 读《我的情报与外交生涯》
11-24 读《朱元璋传》
11-20 技术组长管理经验总结
10-07 开源分布式向量检索系统Vearch解剖
09-19 读 《置身事内》
08-14 谈一谈架构师这个称号
07-24 读凤凰架构

2020

12-27 2020年工作总结

2019

07-29 我为什么从腾讯离职

2018

06-23 读《长安十二时辰》
03-03 关于招聘和面试的个人感悟

2016

03-17 Bjarne Stroustrup previews C++ 17

2015

10-11 Android 6.0 openssl crash
09-10 读<程序员的呐喊>
01-14 MongoDB中的$in和$elemMatch

2014

12-07 Windbg关联dmp文件
11-22 Windbg定位内存泄露的一种简单方法
11-15 C++API设计 - 笔记
10-26 读《摩托车修理店的未来工作哲学》
08-31 互联网公司“24小时待命”的陋习
08-25 C++14-大餐后的甜点
08-18 实现无锁算法的常见陷阱
07-21 读《寻找家园》
07-08 关于重构的一些想法
06-28 Linux下开启TRIM
05-03 Dock项目个人总结
04-27 读《苏东坡传》
04-18 谁在用C++ STL?
04-08 入职一周年记
02-23 读:人生元编程
02-20 春节杂记
01-01 2013年(下半年)个人总结

2013

12-26 为什么要学Ruby