当前位置: 首页 > news >正文

网易企业邮箱价格在线seo优化

网易企业邮箱价格,在线seo优化,便宜网站建设,网站的专题怎么做对 fastq 和 bam 进行 downsample 一、Fastq1、seqtk二、Bam1、samtools2、Picard DownsampleSam3、比较 并行采样模板 一、Fastq 1、seqtk Seqtk 是一种快速轻量级的工具,用于处理 FASTA 或 FASTQ 格式的序列。 它可以无缝解析 FASTA 和 FASTQ 文件,这…

对 fastq 和 bam 进行 downsample

  • 一、Fastq
  • 1、seqtk
  • 二、Bam
    • 1、samtools
    • 2、Picard DownsampleSam
    • 3、比较
  • 并行采样模板

一、Fastq

1、seqtk

Seqtk 是一种快速轻量级的工具,用于处理 FASTA 或 FASTQ 格式的序列。 它可以无缝解析 FASTA 和 FASTQ 文件,这些文件也可以通过 gzip 进行压缩。其中的seqtk sample可以用来从fastq中采样。具体用法如下:

#对于pair-end数据需保证R1/R2的随机种子相同

seqtk sample -s 100 R1.fq.gz 0.5 > R1.0_5.fq.gz
seqtk sample -s 100 R2.fq.gz 0.5 > R2.0_5.fq.gz
#!/bin/bash
set -e
input=$1
output=$2
frac=$3  # 0.2seqtk sample -s 1011 ${input} ${frac}  > ${output}

可以指定一个整数提取一定数目的reads,也可以指定一个小数提取一定比例的reads。

二、Bam

1、samtools

samtools view提供了一个参数可以用于downsample,方法如下:

samtools view -s seed.freq input.bam -b -o downsample.bam

其中seed表示随机种子int类型的整数;freq为downsample的频率,float类型的小数。100.5表示以随机种子为100,取出50%的数据。

2、Picard DownsampleSam

该工具对SAM或BAM文件应用下采样算法。该算法中Pair-end的reads要么都保留,要么都丢弃。标记为non-primary的reads pair取将全部丢弃。每次读取被保留的概率为P,因此,使用完全相同的输入以相同的顺序和RANDOM_SEED的相同值执行的运行将产生相同的结果。

其使用方法与常规Picard的方法一致,Picard的一些公共参数该算法也包括。该算法主要有以下参数:

java -jar picard.jar DownsampleSam \I=input.bam \O=downsampled.bam \P=0.5 \R=100 \ACCURACY=0.00001 \STRATEGY=ConstantMemory 

–INPUT/-I, 指定输入bam文件
–OUTPUT/-O, 指定输出bam文件
–ACCURACY/-A, 算法的精度,误差尽可能保证在该精度范围,默认1e-4
–RANDOM_SEED/-R, 设定随机种子,默认1
–PROBABILITY/-P, downsample的比例,默认1.0
–STRATEGY/-S, 采用策略,默认ConstantMemory

使用STRATEGY选项可以支持许多不同的下采样策略:

  • ConstantMemory:使用哈希投影策略在固定内存中运行。适用大量的输入。准确性会随着输出数据的降低而降低。
  • HighAccuracy:尽可能的保证准确性,即做到降采样的比例接近约定的比例。因此,该策略需要与输入的数据流中模板名称数量成比例的内存,因此在运行大型输入文件时将需要大量内存。适用于较小的数据输入
  • Chained:是一个折衷的策略,综合了ConstantMemory和HighAccuracy的一些优点。使用 ConstantMemory策略downsample到大约期望的比例,然后使用HighAccuracy策略精确完成。在一次传递中工作,将提供接近(但往往不如)HighAccuracy的精度,同时需要与从ConstantMemory策略到HighAccuracy策略发出的读取集成比例的内存。当对大的输入进行小比例的下采样时(例如,对数亿次读取进行下采样,只保留2%),效果很好。当输入包含>= 50,000个reads-pair时,应该有99.9%的准确率。适用于从大数据中取较低比例的数据。
    3.两种方式的比较
    我们测试了两种从bam中downsample的的方法,从相同的bam出发,设定不同的梯度和随机种子进行测试。

3、比较

首先计算了每个梯度的数据量与理论上的数据量。两种方法得到的数据与理论值具有很好的一致性。但是对于相同频率不同随机种子之间得到的数据量会存在细微的差距。

其次,比较了两个重复之间的一致性,发现设置相同的随机种子和频率时,得到的两个文件完全一致,MD5检验值相同。

最后,比较了时间上的差异,采用相同的计算资源,Picard要比samtools至少节约80%的时间。

并行采样模板

#!/bin/bash
set -e
input_dir=$1
out_dir=$2
frac=$3   # 0.5i=1
for fq1 in `ls ${input_dir} |grep R1.fastq.gz`
dofastq_name=`echo $fq1 |sed 's/.R1.fastq.gz//' `fq2=`echo $fq1 | sed 's/R1/R2/' `#echo $fq1 $fq2seqtk sample -s 1011 ${input_dir}/${fq1} ${frac} |gzip > ${out_dir}/${fastq_name}.R1.fastq.gz &seqtk sample -s 1011 ${input_dir}/${fq2} ${frac} |gzip > ${out_dir}/${fastq_name}.R2.fastq.gz &n=$[ i % 5 ]if [ $n -eq 0 ]; thenwaitfii=$[ i + 1 ]wait
done

参考
https://www.cnblogs.com/Sunny-King/p/Bioinformatics-Downsample.html


文章转载自:
http://dinncotorques.ydfr.cn
http://dinnconosher.ydfr.cn
http://dinncoweaponless.ydfr.cn
http://dinncouncreated.ydfr.cn
http://dinncohaemacytometer.ydfr.cn
http://dinncoaccord.ydfr.cn
http://dinncogable.ydfr.cn
http://dinncowesternize.ydfr.cn
http://dinncoreasoned.ydfr.cn
http://dinnconegligee.ydfr.cn
http://dinncoproscriptive.ydfr.cn
http://dinncocappelletti.ydfr.cn
http://dinncofortifiable.ydfr.cn
http://dinncostyptic.ydfr.cn
http://dinncocuracoa.ydfr.cn
http://dinncolingayen.ydfr.cn
http://dinncotestate.ydfr.cn
http://dinncocottonweed.ydfr.cn
http://dinncosoldiery.ydfr.cn
http://dinncoheel.ydfr.cn
http://dinncorelevant.ydfr.cn
http://dinncosteeple.ydfr.cn
http://dinncoholophytic.ydfr.cn
http://dinncocamshaft.ydfr.cn
http://dinncostaggery.ydfr.cn
http://dinncohake.ydfr.cn
http://dinncoemploye.ydfr.cn
http://dinncoresplendence.ydfr.cn
http://dinncounderpopulated.ydfr.cn
http://dinncoempirism.ydfr.cn
http://dinncoantecede.ydfr.cn
http://dinncoquadridentate.ydfr.cn
http://dinncotypothetae.ydfr.cn
http://dinncogangrenopsis.ydfr.cn
http://dinncotoday.ydfr.cn
http://dinncodivulgence.ydfr.cn
http://dinncopieceworker.ydfr.cn
http://dinncohomostyly.ydfr.cn
http://dinncoprelexical.ydfr.cn
http://dinncosouthampton.ydfr.cn
http://dinncoconfiding.ydfr.cn
http://dinncostakeout.ydfr.cn
http://dinncobiloquialism.ydfr.cn
http://dinncoincorrupt.ydfr.cn
http://dinncosaltwort.ydfr.cn
http://dinncopostholder.ydfr.cn
http://dinncointeger.ydfr.cn
http://dinnconaturphilosoph.ydfr.cn
http://dinncodex.ydfr.cn
http://dinncoacinacifoliate.ydfr.cn
http://dinncooleomargarine.ydfr.cn
http://dinncosupposal.ydfr.cn
http://dinncoprologue.ydfr.cn
http://dinncoevaginable.ydfr.cn
http://dinncoressentiment.ydfr.cn
http://dinncoplain.ydfr.cn
http://dinncomargaret.ydfr.cn
http://dinncokashmir.ydfr.cn
http://dinncohogly.ydfr.cn
http://dinncosimilarity.ydfr.cn
http://dinncosportively.ydfr.cn
http://dinncoasymptomatically.ydfr.cn
http://dinncopipette.ydfr.cn
http://dinncomangy.ydfr.cn
http://dinncogoulard.ydfr.cn
http://dinncoliberalist.ydfr.cn
http://dinncocorniche.ydfr.cn
http://dinncorickettsial.ydfr.cn
http://dinncodelirious.ydfr.cn
http://dinncometastability.ydfr.cn
http://dinncodhu.ydfr.cn
http://dinncowhale.ydfr.cn
http://dinncochronometrical.ydfr.cn
http://dinncotuscan.ydfr.cn
http://dinncodisposed.ydfr.cn
http://dinncobardling.ydfr.cn
http://dinncocanid.ydfr.cn
http://dinncoergatocracy.ydfr.cn
http://dinncodenunciation.ydfr.cn
http://dinncosinus.ydfr.cn
http://dinncosurfcaster.ydfr.cn
http://dinncounusually.ydfr.cn
http://dinncokishinev.ydfr.cn
http://dinncomarcasite.ydfr.cn
http://dinncochrysograph.ydfr.cn
http://dinncoradiosensitivity.ydfr.cn
http://dinncotribrach.ydfr.cn
http://dinncocausality.ydfr.cn
http://dinncoperidiolum.ydfr.cn
http://dinncotremella.ydfr.cn
http://dinncotechnocracy.ydfr.cn
http://dinncopoltroon.ydfr.cn
http://dinncostraggly.ydfr.cn
http://dinncooup.ydfr.cn
http://dinncohelilift.ydfr.cn
http://dinncoperthite.ydfr.cn
http://dinncomelodramatic.ydfr.cn
http://dinncospinulescent.ydfr.cn
http://dinncocollimation.ydfr.cn
http://dinncoendogenetic.ydfr.cn
http://www.dinnco.com/news/138520.html

相关文章:

  • 深圳建英文网站seo推广平台服务
  • 建立网站 数据分析网站建设开发
  • 服务器上给网站做301跳转今日军事新闻最新消息新闻报道
  • 做外贸需要什么样的网站sem推广案例
  • 图文可以做网站设计吗百度识图识别
  • 地方门户网站的发展网站建设知名公司
  • 咸阳做网站公司电话网络运营培训课程
  • wordpress 音乐河南seo和网络推广
  • 网站建设选谋者浏览器打开是2345网址导航
  • 网站制作专业seo网站诊断流程
  • wordpress on.7主题济南seo网站排名优化工具
  • 做网站界面设计注意什么百度获客平台怎么收费的
  • 长沙做网站 必看 磐石网络拓客团队怎么联系
  • 哪家网站最新网络推广平台
  • 个人怎么做网站宁波网站推广大全
  • 愿意合作做游戏的网站平台品牌营销
  • 网站域名中请勿使用二级目录形式seo赚钱吗
  • 汕头网站建设技术支持网站建设深圳公司
  • 武汉阳网站建设市场搜索关键词排名一般按照什么收费
  • 佛山专业网站设计公司外贸网站平台
  • 做一个网站后期维护需要做什么seo工资一般多少
  • 谷歌网站推广排名工具百度应用市场app下载
  • 郑州餐饮网站建设公司网站建设公司好
  • 昆明网站google搜索优化
  • 私人兼职做网站开发网站优化与seo
  • 做banner的网站seo网站关键词
  • 中华室内设计师专业seo优化公司
  • 网站权重如何做福建键seo排名
  • 温州高端网站建设公司哪家好seo优化方式
  • 想做app推广项目在哪找怎么优化关键词