Gene BAS1750 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1750
Symbol
ID	2851725
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	1772070
End bp	1773278
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	36%
IMG OID	637505001
Product	enterotoxin
Protein accession	YP_028014
Protein GI	49184762
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.385286
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAAAA AACCTTATAA AGTAATGGCT CTTTCAGCAC TTATGGCAGT ATTTGCAGCA 
GGGAATATTA TGCCGGCCCA TACGTATGCA GCTGAAAGTA CTGTGAAACA AGCTCCAGTT 
CATGCGGTAG CAAAAGCTTA TAATGACTAT GAAGAATACT CATTAGGACC AGAAGGCTTA 
AAAGATGCAA TGGAAAGAAC AGGTTCAAAC GCTTTAGTAA TGGATCTGTA TGCTTTAACA 
ATCATTAAAC AAGGTAATGT TAACTTTGGA AATGTATCGA CTGTTGATGC TGCTTTAAAA 
GGAAAAGTGA TTCAGCACAA GGATACAGCT AGAGGAAATG CGAAGCAATG GTTAGATGTA 
TTAAAGCCAC AGCTTATTTC AACGAATCAA AATATCATTA ACTATAATAC GAAATTCCAA 
AACTATTATG ATACTTTAGT TGCTGCGGTT GATGCAAAAG ATAAAGCGAT ACTTACGAAA 
GGGTTAACTA GATTATCAAG TAGTATTAAT GAAAATAAAG CGCAAGTAGA TCAGTTAGTA 
GAAGACTTGA AGAAATTCCG AAATAAAATG ACGTCGGATA CGCAAAACTT CAAGGGTGAT 
GCAAATCAAA TTACATCTAT TTTAGCTAGT CAAGACGCTG GAATCCCGCT TCTGCAAAAT 
CAAATTACAA CGTACAATGA AGCAATTAGT AAATATAATG CAATTATTAT CGGTTCATCA 
GTTGCGACAG CTCTAGGGCC AATTGCAATT ATCGGTGGTG CAGTAGTTAT TGCTACAGGT 
GCAGGAACGC CACTAGGAGT CGCATTAATT GCAGGAGGCG CAGCGGCTGT AGGCGGTGGT 
ACAGCTGGAA TCGTATTAGC GAAGAAAGAG CTTGATAATG CACAAGCTGA AATTCAAAAA 
ATAACTGGAC AAATTACAAC TGCTCAATTA GAAGTAGCTG GGTTAACGAA CATTAAGACA 
CAAACGGAGT ATTTAACAAA TACAATTGAT ACTGCAATTA CAGCGTTGCA AAACATTTCA 
AACCAATGGT ACACAATGGG ATCAAAATAC AATTCTTTAC TTCAAAATGT AGATTCAATT 
AGTCCAAACG ACCTTGTTTT CATTAAAGAA GATTTAAACA TTGCGAAAGA TAGCTGGAAA 
AACATTAAAG ACTATGCAGA AAAGATTTAT GCTGAAGATA TTAAAGTAGT AGATACGAAA 
AAAGCATAA

Protein sequence

MTKKPYKVMA LSALMAVFAA GNIMPAHTYA AESTVKQAPV HAVAKAYNDY EEYSLGPEGL 
KDAMERTGSN ALVMDLYALT IIKQGNVNFG NVSTVDAALK GKVIQHKDTA RGNAKQWLDV 
LKPQLISTNQ NIINYNTKFQ NYYDTLVAAV DAKDKAILTK GLTRLSSSIN ENKAQVDQLV 
EDLKKFRNKM TSDTQNFKGD ANQITSILAS QDAGIPLLQN QITTYNEAIS KYNAIIIGSS 
VATALGPIAI IGGAVVIATG AGTPLGVALI AGGAAAVGGG TAGIVLAKKE LDNAQAEIQK 
ITGQITTAQL EVAGLTNIKT QTEYLTNTID TAITALQNIS NQWYTMGSKY NSLLQNVDSI 
SPNDLVFIKE DLNIAKDSWK NIKDYAEKIY AEDIKVVDTK KA