MacでのNCBI Blast+のインストール方法・使用方法

インターネット上にあるNCBI Blast+のほとんどの情報は古いか間違っていて役に立ちません。そこで、我々BlastStationサポートチームはNCBI Blast+をMacにインストールして利用したい方のためにこのページを作成しました。 以下の手順はOS X 10.9 Mavericks、10.10 Yosemiteと10.11 El Capitanを使用しているMacで正常に動くことを確認しています。
この手順は2016年6月2日にリリースされた最新のNCBI Blast+ (ver. 2.4.0)をサポートしています。

もしも下記の手順がわからないときはBlastStation2またはBlastStation-Local64をお試しになることをお勧めします。直感的な操作方法、驚くほどの使い易さ、検索結果の表計算プログラムへのエクスポート、検索結果配列をFASTAフォーマットでエクスポートなどの特徴を持ったBlastStationを使えば5分以内にBlast検索を開始できます。

お求め易く価格改定いたしました。直販で消費税も不要なのでほぼ半額になっています。
クレジットカードでご購入いただけます。こちらからどうぞ。
BlastStation2BlastStation-Local64

    

1. インストール

  • 以下のリンクをクリックしてインストーラをダウンロードします。
     ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.4.0/ncbi-blast-2.4.0+.dmg
  • ncbi-blast-2.4.0+.dmgをダブルクリックしてマウントします。
  • ncbi-blast-2.4.0+.pkgをダブルクリックしてインストーラを起動 します。
  • インストーラの指示に従ってインストールします。
    すべてのプログラムは "/usr/local/ncbi/blast/bin"にインストールされます 。
    アンインストールするときはマウントされたイメージの中にある uninstall_ncbi_blast.zip をダブルクリックして解凍し、起動してください。
        BLAST HelpページへのリンクがあるだけのREADME.txtは "/usr/local/ncbi/blast/doc"にインストールされます 。    user_manual.pdf はインストーラに含まれなくなりました。

2. 環境設定

  • NCBI Blast+を使用するにはBlastデータベースファイルのあるフォルダーを指定しなくてはなりません。そのためのひとつの手段は.ncbircを使うことです。
  • .ncbircという名前のファイルをホームに作ります。1例を以下に示します。ここではアカウントはMyAccount.だと仮定しています。
; Start the section for BLAST configuration
[BLAST]
; Specifies the path where BLAST databases are installed
BLASTDB=/Users/MyAccount/blast/db
; Specifies the data sources to use for automatic resolution
; for sequence identifiers
DATA_LOADERS=none
; Specifies the BLAST database to use resolve protein sequences
;BLASTDB_PROT_DATA_LOADER=nr
; Specifies the BLAST database to use resolve protein sequences
;BLASTDB_NUCL_DATA_LOADER=nt
; Windowmasker settings (experimental)
[WINDOW_MASKER]
WINDOW_MASKER_PATH=/Users/MyAccount/blast/db/windowmasker
; end of file
  • Blastデータベースディレクトリの作成
    1) ターミナルを起動します。
    2) "mkdir -p ~/blast/db"と入力してリターンします。
  • インストーラは/etc/paths.d/ncbi_blastをインストールしてパスを設定します。

3. データベースのダウンロード

  • 次のリンクをクリックしてNCBIのftpサーバーにアクセスします。 ftp://ftp.ncbi.nih.gov/blast/db/
  • ダウンロードしたいデータベースファイル(たとえば nt.00.tar.gz)をダブルクリックします。
  • ファイルを  ~/blast/db に保存します。
  • ターミナルを起動します。
  • "cd ~/blast/db" と入力してリターンします。
  • "tar xfz nt.00.tar.gz" と入力してリターンするとファイルは展開されます。nt.00.tar.gzはダウロードしたファイル名にしてください。

4. データベースの作成

  • FASTAファイルをダウンロードするか作成します。ここではファイル名はtestdb.fastaと仮定します。
  • testdb.fastaを ~/blast/dbにコピーします。
  • ターミナルを起動します。
  • "cd ~/blast/db" と入力してリターンします。
  • DNAの場合は"makeblastdb -in testdb.fasta -out testdb -dbtype nucl"、タンパク質の場合は"makeblastdb -in testdb.fasta -out testdb -dbtype prot" と入力してリターンします。testdbという名前のデータベースができます。
  • Type "makeblastdb -help" for advanced options.

5. NCBI-Blast+コマンド起動

  • DNAかタンパク質のFASTAファイルを作成します。ファイルには複数のFASTAデータを入力できます。ここではファイル名は test_dna.fastaとtest_protein.fastaと仮定します。nt.00はDNAデータベースでnr.00はタンパク質データベー スです。いずれも  ftp://ftp.ncbi.nih.gov/blast/db/ からダウンロードできます。 これらのデータベースは既にダウンロードされ、展開されているものとします。
  • blastn
    1) ターミナルを起動します。
    2) "blastn -query test_dna.fasta -db nt.00 -out test.html -html" と入力してリターンします。
    3) "blastn -help"でコマンドオプションの詳細が表示されます。
  • blastp
    1) ターミナルを起動します。
    2) "blastp -query test_protein.fasta -db nr.00 -out test.html -html" と入力してリターンします。
    3) "blastp -help"でコマンドオプションの詳細が表示されます。
  • Blast検索でコアを複数使う方法
    1) コアを2個使うときは"-num_threads 2"と指定します。