[Glang-devel] TAXONOMYの例外処理

Back to archive index

Haruo Suzuki hs568****@corne*****
2010年 2月 11日 (木) 06:53:12 JST


一部の原核生物(Bacillus, Streptococcus, Staphylococcus,  
Synechococcus)で、GenBankファイルの分類群の情報が欠損 
しています。

G/IO/GenBankI.pm
の
     $this->{HEADER} =~ /((Archaea|Bacteria|Eukaryota);.*?)\n\S/s;
     $this->{TAXONOMY}->{0} = $1;
     $this->{TAXONOMY}->{0} =~ s/\n//g;
     $this->{TAXONOMY}->{0} =~ s/\s+ / /g;
     $this->{TAXONOMY}->{0} =~ s/; /;/g;
の後に
$this->{TAXONOMY}->{0} =~ s/Bacillales/Bacilli;Bacillales/;
$this->{TAXONOMY}->{0} =~ s/Lactobacillales/Bacilli;Lactobacillales/;
$this->{TAXONOMY}->{0} =~ s/Staphylococcus/ 
Staphylococcaceae;Staphylococcus/;
$this->{TAXONOMY}->{0} =~ s/Synechococcus/ 
Synechococcales;Synechococcaceae;Synechococcus/;
を加えることにより修正できます。

以下のファイルで確認しました。
$file = 'NC_000964.gbk'; # Bacillus subtilis subsp. subtilis str. 168
$file = 'NC_004116.gbk'; # Streptococcus agalactiae 2603V/R
$file = 'NC_002951.gbk'; # Staphylococcus aureus subsp. aureus COL
$file = 'NC_007604.gbk'; # Synechococcus elongatus PCC 7942

Haruo Suzuki, Ph.D.
Department of Population Medicine and Diagnostic Sciences
College of Veterinary Medicine
Cornell University
Ithaca, NY 14853, USA
TEL: +1-607-253-4228
E-MAIL: hs568****@corne*****




Glang-devel メーリングリストの案内
Back to archive index