AI

从数据库到 AI

Posted by w@hidva.com on August 13, 2024

在昨天晚上, 在我完成了 概率导论(9): 经典统计推断 推送之后, 我终于算是结束了自己数学知识重建体系的第一阶段. 当时忽然感觉到一阵恍惚, 我是为啥要重建自己的数学知识来着?

哦对, 想起来了, 是当时在看 jemalloc 采样逻辑时那块代码死活看不懂, 幸好 jemalloc 大佬留了关于采样逻辑背后设计的文档, 但不幸的是文档也是看不懂, 各种不知道的名词满天飞, 对这些名词的搜索又蹿出了另一大坨不知道的名词, 看得让人冷汗直冒心灰意冷. 当时咬咬牙啃了下 Dimitri 概率导论前两章关于概率, 离散随机变量的知识, 幸好这两章不要求太高端的前沿知识. 完事后发现 jemalloc PROFILING_INTERNALS 能磕磕巴巴地啃懂了, 最后还兴高采烈地写了篇总结笔记 jemalloc profile 背后的数学原理. 当时真的好兴奋啊, 一直知道数学有用, 没想到的是居然可以这么有用!

然后就想着一鼓作气啃完 Dimitri 概率导论, 但不幸的是从第三章起开始要求微积分知识了, 而这些我早就忘完啦! 不得不就此放弃, 毕竟工作上还有很多事情要干的, 直到后来第2次再读 spanner 论文时, truetime 那一块涉及到统计也是怎么看都看不懂. 一咬牙一跺脚不能就这么算了, 还是得把数学捡起来! 但面临的第一个问题是, 怎么捡, 这东西一层依赖一层的, 我该从何处入手, 幸好当时脑袋灵光一闪, 就想着跟着大学课程来好了, 大学数学课程安排肯定早考虑好了数学学科之间的依赖关系, 我跟着走就行了. 然后就选择了中科大数学与应用数学培养方案, 因为这个是国内几个顶尖大学中页面做的最好看体验最好的了= 但不幸的是最近发现这个页面登录需要用户登录了, 只有中科大学生才能登录了, 太可惜了.

计划定好之后, 就开始学吧, 就这样利用着晚上那点时间加上休息日的时间依次学习了:

  1. 陶哲轩 analysis i
  2. 史济怀数学分析教程上册
  3. 陶哲轩 analysis ii
  4. 代数学基础
  5. 几何学基础
  6. Peter D. Lax 线性代数.
  7. 史济怀数学分析教程下册.
  8. Dimitri 概率导论

一开始笔记还是记录在小本本上的, 潜意识觉得这样更快更方便一点, 有个手机兜里塞个小本本随时随地可以干起来了.

写满了三个小本本之后发现不行, 检索效率太低了. 所以又换成了 markdown + mathjax 直接记录, 期间还给微信公众号公式编辑插件写了个 功能: 一键转换公式, 这样我的笔记可以不经修改直接发到博客与公众号上了. P.S. 每次看到这个一键转换公式的功能哗哗哗地把我页面中纯文本公式渲染成 svg 都感觉到成就感爆棚啊!

年初给我的前老板在闻炉吃饭的时候我给他显摆了一下我兜里的小本本, 也给他聊了下我对 AI 很感兴趣, 有想法往着这一块转. 在前老板给了我一揽子扎实的意见之后我也相应地更新了下我的学习计划. 直到现在, 直到上周, 我终于完成了这一大坨计划! 而我也会在接下来参与到阿里云 AI 相关团队做一些训练推理框架开发工作. 然后忽然意识到, 想起来去年参加 cpp-submit 的讲师介绍:

花名盏一,在阿里云参与过 AnalyticDBM, AnalyticDB PostgreSQL, Hologres的内核研发工作. 目前在 Hologres 从事分布式以及底层基础设施相关工作. 是 gpdb Contributor, 贡献了 Auto Analyze 特性, 修复过多处分布式事务正确性 bug, 修复了多处内存泄漏, crash 等稳定性问题. 是postgres/postgres, tokio-rs/tokio, facebook/wangle 等开源项目 Contributor. 开发开源了 as2cfg, clayout, jegdb 等多种便于 C++ 问题排查的工具

哎呀, 我在数据库上面的积累是不是要被慢慢地遗忘了=.