バイオインフォマティクス用オリジナルツール



GenomeViewerをバージョンアップしました

BLAST2.0データ用コマンド

・一部ツールをLinux用に移植しました。ダウンロードはこちらから

・GenBankファイルなどのビューワのダウンロードを開始しました。

画面イメージ


GenBankファイルを処理するためのC++用ライブラリが完成しました。 同様なライブラリがPerl、Java用などに用意されているようですが、使ったことがないので詳細は不明です。 C++で作ってもNCBIからダウンロードしたファイル(たとえばgbpriN.seqなどの250Mバイト程度のもの)を処理すると、かなり処理時間がかかります。 インタープリタのPerlやJavaで作成したライブラリで、処理速度の問題はないのでしょか?

今回作成したライブラリは、Locationなども完全に解析します。 複雑なLocationでも対応するSequenceを取り出したりすることができます。 このライブラリを使用して幾つかツールを作成しようと思っています。 作成したツールは、このページで公開していくので下記の使用条件に従ってご利用ください。


(1)glsコマンド(Ver1.0a 2003/6/11バージョンアップしました)
GenBankファイルの内容を表示します。
使用可能OS : Windows 95〜Windows XP(一部のOSしか確認していません)
Usage: gls [option...] file
option
	-a ACCESSION表示
	-c bp数等の表示
	-C Sequenceのカウント結果(bp数等の表示)
	-d DEFINITION表示
	-l 詳細形式で表示(adsvnocCオプションのいずれかと併用可)
	-n SequenceにNが使用されているエントリを表示
	-o SequenceにACGTN以外が使用されているエントリを表示
	-s SOURCE表示
	-v VERSION表示
	-f[N] 先頭のSequenceを表示
	-r[N] 後尾のSequenceを表示
	-F[N] 先頭のSequenceを表示(complement)
	-R[N] 後尾のSequenceを表示(complement)
        -h ヘルプ表示
glsのダウンロード(下記の使用条件に同意する)


(2)gftコマンド(Ver1.0a 2003/6/11バージョンアップしました)
GenBankファイルのFEATUREを解析します。
使用可能OS : Windows 95〜Windows XP(一部のOSしか確認していません)
Usage: gft [option...] file LocusName [FeatureName]
option
        -a ACCESSION表示
        -p 配列位置の表示
        -s Sequenceの表示
        -h ヘルプ表示

Status EUSRA
 E:Location解析でエラー
 U:配列位置が不明確(<,>,(1.2)などが使用されている)
 S:Location内に文字列("actg...")が使用されている
 R:replace(...)が使用されています
 A:参照しているaccessionがあります

gftのダウンロード(下記の使用条件に同意する)


(3)gv(Ver1.0 2003/6/11公開開始 2004/2/19バージョンアップ 随時バージョンアップしますので時々見に来てください)
GenBankファイルなどのビューワ

  ・使い方はヘルプページを参照してください。
  ・2004/2/19バージョンアップしました。
   GenBankファイルで"..."が閉じていない時のAPエラーとなる不具合を修正
   サイズの大きなGenBankファイルの読み込みの不具合を修正

画面イメージ

シーケンスの色が違うのはFEATURE部の情報に応じて表示が変化しているためです。

glsのダウンロード(下記の使用条件に同意する)


(4)ggrep(Ver1.0 2003/6/11公開開始)
GenBankファイル用grep
使用可能OS : Windows 95〜Windows XP(一部のOSしか確認していません)
Usage: gft [option...] seq-str [file]
option
        -a ACCESSION表示を抑制
        -p 配列位置の表示を抑制
        -s Sequenceの表示を抑制
        -c 大文字小文字区別
        -S 特殊文字(MRWS...)を考慮
        -h ヘルプ表示
ggrepのダウンロード(下記の使用条件に同意する)


(5)Linux用ツール(2003/6/18公開開始)
gls/gft/ggrep(上記)をLinux用に移植しました。移植した環境はRed Hat Linux 8.0です。

Linux用ツールのダウンロード(下記の使用条件に同意する)


(6)blastdb(Ver1.0Beta 2003/8/25公開開始)
BLAST2.0ファイル用コマンド
使用可能OS : Windows 95〜Windows XP(一部のOSしか確認していません)
Usage: blastdb [option...] ファイル [エントリ番号]
option
        -p Protein
        -n Nucleotid
        -i ファイル情報
        -h ヘッダ情報
        -l 詳細情報情報
        -e データ抽出
        -s シーケンス表示
        -v ヘルプ表示

例)
 nrデータの情報を表示
	blastdb -p nr
	ファイル情報
	ファイルバージョン : 4
	タイトル     : All non-redundant GenBank CDS translations+PDB+SwissProt+PIR+PRF
	作成日       : Aug 18, 2003  4:29 AM
	シーケンス数 : 1503231
	全シーケンスの合計   : 484217701
	最も長いシーケンス長 : 34350

 nrデータの10番目のデータをファイルに出力(nr-10.pin/nr-10.phr/nr-10.psq)
	blastdb -p -e nr 10

 nrデータの100番目のデータのシーケンス情報を表示
	blastdb -p -s nr 100
blastdbのダウンロード(下記の使用条件に同意する)


当サイトのバイオインフォマティクス関連の下記ページも参考にしてください。
バイオインフォマティクス関連オリジナルツールなど
DNA塩基配列から相補配列を生成
アミノ酸配列表記の変換
塩基配列の翻訳
相補配列の翻訳
おすすめのバイオインフォマティクス関連の書籍です。参考にしてください。

初心者でもわかる!バイオインフォマティクス入門 [ 坊農秀雅 ]

価格:3,990円
(2013/1/27 10:50時点)
感想(0件)

バイオインフォマティクスin silico [ 松山泰男 ]

価格:3,675円
(2013/1/27 10:51時点)
感想(0件)


■使用条件
・国公立大学/公的研究機関(日本国内のみ)で非営利の研究目的にご利用ください(それ以外での使用を希望する場合はメールしてください、許可する場合のみ返信します)。 ただし、1ヶ月間だけは試用目的で試用することができます。
・潟Iーキッドでは本(無料配布)ソフトウェアに関するサポートは一切おこなっていません。 電話、FAXなどで本ソフトウェアに関する質問などは行わないでください。 バグ情報はメールでお寄せ下さい(特に回答などは行いませんが、次期バージョンなどで修正しますのでご協力ください)。
・本ソフトウェアおよびドキュメントに関する複製、改変、他への引用、第3者に対する譲渡、賃貸、再使用はできません。ダウンロードしたプログラムは同一組織内のマシンにのみインストールして使用してください。 他の部署等で使用する場合は、別途ダウンロードしてください。
・潟Iーキッドは本ソフトウェアの使用およびその結果の影響に関して一切責任をおいません。
・IBM PC/AT互換機のWindows 95/98/Me/NT4.0/2000/XP、日本国内での使用に限ります。
・本使用条件および著作権法その他に違反するか、本ソフトウェアに関する潟Iーキッドの著作権およびその他の権利を侵害した場合、本ソフトウェアの使用権を失います。
・オーキッドは、本ソフトウェアの内容、デザイン、仕様に関しては、予告なしに変更することがあります。
・本使用条件およびソフトウェアの使用に関して問題が生じた場合は、オーキッド本社所在地を管轄する裁判所を専属管轄裁判所とします。