记一次笔记本尸体拯救
又当了一回图吧垃圾佬。
又当了一回图吧垃圾佬。
本文详细解析了目前常用的稠密对称矩阵特征值求解器使用的数学公式及算法。
年轻人的第一次故地重游。
『如何评价 Frontier 成为首个达到 Exaflops 的超算并拿下 TOP500 第一名』
一点从业人员的吐槽。
最近由于业务需要,我对 COSMA (Communication-Optimal S-partitioned Matrix-multiplication Algorithm) 做了一番比较深入的研究。本文简要概括了并行矩阵乘法的发展历史和思路,并分析了 COSMA 算法的思路和实现。
学校的 A64FX 机器上最近装了 ARM 官方的编译器和加速库套件,我摸了一下。令我无语的是 ARM 的手册里并没有说如何为向量数据类型使用数学函数,只是说他们的编译器可以做自动向量化。我找了一下,反而是从华为鲲鹏的网站上找到了他们的数学库函数说明(顺带吐槽一点华为的数学库也叫 SVML,和英特尔的 Short Vector Math Library 一样),其中列出的接口和此前 GCC 在 x86 平台上的 libmvec 接口命名方式相同。我又查了一下 ARM 加速库里的 libamath 的符号表,果然在里面找到了对应的 SVE 版本接口。下面是我试验过的 ASIMD & SVE 向量数学库接口列表。
摘要:天空岛的方位引起了许多原神玩家好奇心。本文首次尝试利用钟离的岩脊作为标杆,构建长水平面基线和两组相似三角形,从而估算出天空岛的海拔高度约为 3000 米。同一方法测得寒天之钉顶部高度约为 553 米,表明此方法测得高度与实际高度相差约在 12%。
关键词:相似三角形 岩脊 大地基线 高程传递
最近遇到一个小问题:我写了一个小的库,这个库需要同时提供 CUDA device API 和 CPU host C API。本文记录一下编译、打包和链接到这个库的方法。