Tag: dna序列

需要有关Excel和VBAstring处理和存储限制的信息以及build议的解决方法

根据微软博客文章 ,MS Office 2010的最大string长度为32k; 我也通过testing证实了这一点。 问题是我的DNA(DNA序列)远远超过了这个长度,我在整个32k +序列上匹配了DNA的子序列,这个序列可以匹配主序列的任何地方; 这意味着我不能简单地将主序列分成32k个卡盘,因为我需要能够将“子串序列”与整个“主串序列”进行string匹配。 有一点不清楚的是,如果VBA支持处理大于32k的string,如果VBA支持超过32k的string连接可能是一个工作; 这意味着我把“主串序列”分成一行到第N列的32k块,然后当我需要处理一个匹配时,把第1列到第N列中的一行中的string连接起来,匹配,然后转储存储在VBA中的临时“main-string-sequence”。 所以,基本上这个问题是MS-Office 2010只支持长达32k的string,而且我的string比那些为了string匹配而需要处理的string要大得多。