Gene BAS2392 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS2392
Symbol
ID	2852825
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	2388844
End bp	2389920
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	34%
IMG OID	637505639
Product	thermolysin metallopeptidase catalytic subunit
Protein accession	YP_028652
Protein GI	49185400
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3227] Zinc metalloprotease (elastase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00577856
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATA AAAAAGAAAT AGCTATAGTT GCATTAACAA CAGGATTGGT TTTAACAAGC 
ATAGTACCAT ACGGGATAGG TTATGCAGAG GAAACGGGTC AAATGCAAGT TGATATTCAA 
GAGGATTCGT TCCGTACAGG TGAACTTACA AAACCATCAA AAAAAACGCC AGAGAGTGTA 
GTGAAAGATG CACTTAAGGA AAAAACGGAG CATGTTTTGT CTCCAAAACA AGTTAGTGGA 
GACAAAGGGG TAGATTACAA GGTCCTTCAA AAACGTGGTT CATATGATGG GACTACACTT 
GTGCGTTTGC AACAAATATA TGAAGGAAAA GAAGTATATG GACACCAATT GACTGCTCAT 
GTAGATAAAA AGGGTATTAT TAAAAGTGTT TCAGGGGAAA GCGCACAAAA TTTAGAAAAA 
GAAGATTTAA AGAATCCTAT TAATTTATCA AAAGAAGAAG CAAAACAATA TATTTATAAA 
AAGTACGGAA ATGATATTAA ATTTATTTCT GAGCCAGAAG TTAAGGAAGT TATTTTTGTT 
GATGAAAATA ATGGACAGGC TAGCAATGCA TATCAAGTTA CATTTGCGGC TGCCACACCA 
AACTATGTAT CTGGAACTTA TTTAGTGGAT GCCCATAATG GTGTTATGTT GAAAAATACG 
TTACAAGAAT CCGATTTAAA AGTAAGTGAA GAGCAAGTTG AATCTTTAAA GGAGAATAAA 
AAAAGCAATT CCATATCATT AACTGGAACA GGAAAAGATG ATTTAGGGAT AACTCGCATA 
TTTGGTATTT CTGAACAGAG TAACGGAAAA TATGCGCTTG CTGATTATAC AAGAGGGCAA 
GGAATTGAAA CGTACGATGT AAATTATAGA GATATTAATT TTGAAGAAAG ATATTATCCT 
GGTATATTAG CAACTAGCAC TTCAACAACC TTTGATGATC CAAAGGCGGT CAGTGCTCAT 
TTCTTAGCAA CAAAGGTATA TGATTTTTAT AAAGACAAAT ATAAGCGTAA TAGTTTTGAT 
AATAAGGGAA AAAATAGTAT CAGTTGTACA TGCATGGCAT TCAGGAGAAA CAGATGA

Protein sequence

MKNKKEIAIV ALTTGLVLTS IVPYGIGYAE ETGQMQVDIQ EDSFRTGELT KPSKKTPESV 
VKDALKEKTE HVLSPKQVSG DKGVDYKVLQ KRGSYDGTTL VRLQQIYEGK EVYGHQLTAH 
VDKKGIIKSV SGESAQNLEK EDLKNPINLS KEEAKQYIYK KYGNDIKFIS EPEVKEVIFV 
DENNGQASNA YQVTFAAATP NYVSGTYLVD AHNGVMLKNT LQESDLKVSE EQVESLKENK 
KSNSISLTGT GKDDLGITRI FGISEQSNGK YALADYTRGQ GIETYDVNYR DINFEERYYP 
GILATSTSTT FDDPKAVSAH FLATKVYDFY KDKYKRNSFD NKGKNSISCT CMAFRRNR