候选Excelfunction的GPU加速

我目前正在研究编写OpenCL Excel插件。 这将暴露一系列提供Excel计算的函数。 作为概念的certificate,我写了一个Array-sum内核,并成功地公开了这个内核。 它运行良好,没有引入明显的延迟(整个5k元素的数组总和大约需要7ms才开始完成)。

我的问题是,在这种情况下,您认为还有哪些其他候选function是有用的。 我有一些关于Prefix Sum和Mersenne Prime内核的想法。