CUDA Case Study - SGEMM on Pascal

最近自己重新学 CUDA (以前上过课,长时间不用又忘记了),找些经典的 case study 自己照猫画虎弄一次加深一点认识。HPC 领域里一个绕不开的例子就是 xGEMM,即稠密矩阵-矩阵乘法。网上关于 CUDA 如何实现高性能 xGEMM 的介绍不多,而且很多都是 Fermi 时代的资料,面对 Kepler 有详细介绍的只有 Ref No.2 那个网页。我以 Ref No.1, No.2 两个网页的资料和代码为蓝本,一并参考了其他一些文章,自己动手实践了一下,代码在 这里

Read More

不正经的围观群众与吃喝玩乐——我的 ASC17 之旅

时光流转,熬过了半年从零开始的学英语生活,又到1月ASC开球的时候。凑了三年热闹,我自然也不会放过这最后一年。好在今年不用我下场,毕竟我自己作死选了个说难不难说水不水的毕设题目。我又贪玩,中间跑出去日本浪了半个月。所以,又要拖累叶总了,他又要管比赛,又要管我的论文,我真是给他添了太多麻烦了。

Read More