ミラーデータベース
GenBank、EMBL、RefSeq など、主要な生物系データベースの最新版のミラーデータベースを SHIROKANE の /usr/local/db/
以下に設置しています。
これにより、インターネットを経由してデータを取得することなく、各データベースに高速にアクセスすることができます。
設置されているファイルの形式は、以下の 3 種類です。
- Flat ファイル形式 (圧縮されたデータを展開したもの)
- FASTA 形式
- BLAST インデックスファイル形式 (BLAST 検索を行うための形式)
詳しくは下記のページを参照してください。
また、HGC Anonymous FTPサイトでは、各種データのミラーをそのままの状態で再配布しています。 詳しくは Anonymous FTP サービスを参照してください。
関連
検索対象となるデータベースとエイリアスファイルのパス情報
検索対象となるデータベースと、エイリアスファイルのパスの確認の際には、以下の表をご参照ください。
検索対象となるデータベース | エイリアスファイルのパス |
---|---|
GenBank リリースの全ファイル | /usr/local/db/blast/genbank/genbank-rel.nal |
GenBank リリース + アップデート | /usr/local/db/blast/genbank-upd/genbank.nal |
GenPept リリース + アップデート | /usr/local/db/blast/genpept-upd/genpept.pal |
EMBL リリースの全ファイル | /usr/local/db/blast/embl/embl-rel.nal |
EMBL リリース + アップデート | /usr/local/db/blast/embl-upd/embl.nal |
RefSeq-Genomic + RefSeq-RNA | /usr/local/db/blast/refseq/refseq-na-rel.nal |
RefSeq リリース + アップデート Genomic + RNA | /usr/local/db/blast/refseq-upd/refseq.nal |
RefSeq リリース + アップデート Protein | /usr/local/db/blast/refseq-upd/refseq.pal |
Swissprot + TrEMBL | /usr/local/db/blast/uniprot/uniprot.pal |
NCBI nt + EST + GSS + HTGS + STS + patnt + WGS | /usr/local/db/blast/ncbi/ncbi.nal |
BLAST 検索時の検索対象 DB として、エイリアスファイルを指定することで、複数の BLAST ファイルを対象とした検索を行なうことができます。
エイリアスファイルを使用し、BLAST 検索を行う場合は、従来のBLASTユーザ向けBLAST+利用方法をご参照ください。
BLAST 検索で使用する検索用クエリが必要な場合に、EMBOSS のコマンドで作成することが可能です。
各データベースファイルの設置パスと詳細
各データベースの設置パス、および詳細は以下の表をご参照ください。
- (例) GenBank の blast 形式のファイルの設置パス:
/usr/local/db/blast/genbank/
以下
データベース名 | パス/usr/local/db/ | 設置されているファイルの詳細 (圧縮ファイルは解凍し設置) | |
---|---|---|---|
GenBank | flat/ | genbank/ | ftp://ftp.ncbi.nih.gov/genbank/ 以下の*.seq ファイル |
fasta/ | 上記を FASTA 形式に変換したもの | ||
blast/ | 上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの | ||
GenBank-UPD | flat/ | genbank-upd/ | ftp://ftp.ncbi.nih.gov/genbank/daily-nc/ 以下の全ファイル |
fasta/ | 上記ファイルの内*.flat を FASTA 形式に変換したもの | ||
blast/ | 上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの | ||
GenPept | - | genpept/ | - |
fasta/ | GenBank の seq ファイル内の翻訳可能なエントリを翻訳し、FASTA 形式に変換したもの | ||
blast/ | 上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの | ||
GenPept-UPD | - | genpept-upd/ | - |
fasta/ | GenBank-UPD の*.flat ファイル内の翻訳可能なエントリを翻訳し、FASTA 形式に変換したもの | ||
blast/ | 上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの | ||
EMBL | flat/ | embl/ | ftp://ftp.ebi.ac.uk/pub/databases/embl/release/ 以下の*.dat ファイル |
fasta/ | 上記を FASTA 形式に変換したもの | ||
blast/ | 上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの | ||
EMBL-UPD | flat/ | embl-upd/ | ftp://ftp.ebi.ac.uk/pub/databases/embl/new/ 以下の全ファイル |
fasta/ | 上記ファイルの内、r*.dat を FASTA 形式に変換したものの | ||
blast/ | 上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの | ||
RefSeq-Genomic | flat/ | refseq/ | ftp://ftp.ncbi.nih.gov/refseq/release/ 以下の全ファイル |
fasta/ | /usr/local/db/flat/refseq/ 以下の各ディレクトリに含まれる*.genomic.fna をそれぞれ統合したファイル | ||
blast/ | 上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの | ||
RefSeq-RNA | flat/ | refseq/ | RefSeq-Genomic と同様 |
fasta/ | /usr/local/db/flat/refseq/ 以下の各ディレクトリに含まれる*.rna.fna をそれぞれ統合したファイル | ||
blast/ | 上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの | ||
RefSeq-Protein | flat/ | refseq/ | RefSeq-Genomic と同様 |
fasta/ | /usr/local/db/flat/refseq/ 以下の各ディレクトリに含まれる*.protein.faa をそれぞれ統合したファイル | ||
blast/ | 上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの | ||
RefSeq-UPD-NA | flat/ | refseq-upd/ | ftp://ftp.ncbi.nih.gov/refseq/daily/ 以下の全ファイル |
fasta/ | /daily 以下の rsnc.*.*.fna を統合したファイル | ||
blast/ | 上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの | ||
RefSeq-UPD-AA | flat/ | refseq-upd/ | RefSeq-UPD-NA と同様 |
fasta/ | /daily 以下の rsnc.*.*.faa を統合したファイル | ||
blast/ | 上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの | ||
UniProt | flat/ | uniprot/ | ftp://ftp.uniprot.org/pub/databases/uniprot/knowledgebase/ 以下の全ファイル |
fasta/ | Swiss-Prot、TrEMBL の対象ファイル | ||
blast/ | 上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの | ||
Swiss-Prot (UniProt の一部として設置) | flat/ | uniprot/ | UniProt と同様 |
fasta/ | uniprot_sprot.fasta と uniprot_sprot_varsplic を flat/からコピーしたもの | ||
blast/ | 上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの | ||
TrEMBL (UniProt の一部として設置) | flat/ | uniprot/ | UniProt と同様 |
fasta/ | uniprot_trembl.fasta と uniprot_trembl_varsplic を flat/からコピーしたもの | ||
blast/ | 上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの | ||
NCBI-nt | - | ncbi/ | - |
fasta/ | ftp://ftp.ncbi.nih.gov/blast/db/FASTA/nt.gz を解凍し設置 | ||
blast/ | ftp://ftp.ncbi.nih.gov/blast/db/ 以下の nt.*.tar.gz を解凍し設置 | ||
NCBI-nr | - | ncbi/ | - |
fasta/ | ftp://ftp.ncbi.nih.gov/blast/db/FASTA/nr.gz を解凍し設置 | ||
blast/ | ftp://ftp.ncbi.nih.gov/blast/db/ 以下の nr.*.tar.gz を解凍し設置 | ||
PDB | flat/ | pdb/ | ftp://ftp.rcsb.org/pub/pdb/data/structures/divided/pdb/ 以下の全ファイル |
- | - | ||
- | - | ||
EPD | flat/ | epd/ | ftp://ccg.vital-it.ch/epd/current/ 以下の全ファイル |
- | - | ||
- | - | ||
PROSITE | flat/ | prosite/ | ftp://au.expasy.org/databases/prosite/release_with_updates/ 以下の全ファイル |
- | - | ||
- | - | ||
Pfam | flat/ | pfam/ | ftp://ftp.ebi.ac.uk/pub/databases/Pfam/current_release 以下の全ファイル |
- | - | ||
- | - |