sra
SRA-Tools (Sequence Read Archive Tools) 是一组用于处理美国国家生物技术信息中心 (NCBI) 的序列读取档案(Sequence Read Archive, SRA)数据的命令行工具。它包括了一系列实用程序,主要用于下载、转换和处理基因组测序数据。以下是一些常用的工具和功能:
- fastq-dump:将SRA格式的文件转换为常见的FASTQ格式,用于基因组序列的进一步分析。
- prefetch:用于从SRA数据库下载数据。
- fasterq-dump:是 fastq-dump 的改进版本,速度更快,通常用于高效地将SRA文件转换为FASTQ文件。
- vdb-validate:用于验证下载的SRA数据是否完整、无损。 因此工欲善其事必先利其器,再次学习一下。
conda的安装可以参考上一期推文:
安装流程
关于conda的镜像问题,选择其一设置即可
代码语言:javascript代码运行次数:0运行复制#删除conda 镜像文件 (如果第一次配置则不需要)
rm ~/.condarc
# 添加北京外国语大学的镜像源
conda config --add channels /
conda config --add channels /
conda config --add channels /
conda config --set show_channel_urls yes
# 添加阿里云的镜像源
conda config --add channels
conda config --add channels
conda config --add channels
conda config --add channels
conda config --set show_channel_urls yes
# 添加北京大学的镜像源
conda config --add channels /
conda config --add channels /
conda config --add channels /
conda config --set show_channel_urls yes
# 添加清华大学的镜像源
conda config --add channels /
conda config --add channels /
conda config --add channels /
conda config --set show_channel_urls yes
# 添加南方科技大学的镜像源
conda config --add channels /
conda config --add channels /
conda config --add channels /
conda config --set show_channel_urls yes
# 清理一下缓存
conda clean -i
1.代码安装sra-stool工具
如果能顺利安装就是好事,估计大部分的时候可能安装不上~
代码语言:javascript代码运行次数:0运行复制# 安装前建议先创建环境哈!!
conda install -y sra-tools
2.网页安装sra-tools工具
复制这个Ubuntu linux 64 bit architecture的下载链接
下载软件
代码语言:javascript代码运行次数:0运行复制# 一般会创建一个软件管理文件夹
# 然后cd过去
cd ./biosoft/
wget .1.1/sratoolkit.3.1.1-ubuntu64.tar.gz
解压缩软件
代码语言:javascript代码运行次数:0运行复制tar -zxvf sratoolkit.3.1.1-ubuntu64.tar.gz
加载到环境
代码语言:javascript代码运行次数:0运行复制echo "export PATH=/home/data/t200558/biosoft/sratoolkit.3.1.1-ubuntu64/bin:\$PATH" >> ~/.bashrc
source ~/.bashrc
# check一下
which fastq-dump
check一下fastq-dump是否存在hhh
参考资料:
- sra-tools: .-prefetch-and-fasterq-dump
注:若对内容有疑惑或者有发现明确错误的朋友,请联系后台(欢迎交流)。更多内容可关注公众号:生信方舟
- END -
发布评论