CPU Case Study - Optimizing DGEMM 2017-07-26 | { C } { SIMD } { GEMM } { Cache } Yet Another GEMM Study. 两年前我按 Ref. 1 的页面(以前还没有 GitHub Repo 和 Markdown pages 呢)做过一次 DGEMM Optimization,当时做的效果其实不是很好。去年叶老师给我看了一下 BLIS 这个项目,说里面分块和分级 Cache 的思路值得一看。前两天一搜,居然出了 Ref. 2 这个 Repo,有如此详细的指导和参考代码,不自己造一次轮子简直说不过去了。我最后撸出来的代码在 这里。 Read On »
排序与 Cache Miss 2017-06-24 | { C } { Cache } { Sorting } 最近学完了 CSE 6220 这门课,补完了一些基础理论知识。这门课有6个 lab work,最后一个 Cache-Oblivious Sorting 有些意思,记录一点我的思考。 Read On »