本研究针对微生物组测序数据中人类DNA污染带来的隐私泄露和分析干扰问题,开发了基于间隔种子(gapped k-mer)的快速、低内存占用的污染清除工具Cleanifier。该方法利用人类泛基因组索引,通过Cuckoo哈希表或概率过滤器实现高效查询,在保证高精度的同时大幅 ...