Gene BAS1239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1239
Symbol
ID	2850122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	1282791
End bp	1283585
Gene Length	795 bp
Protein Length	264 aa
Translation table	11
GC content	39%
IMG OID	637504495
Product	phosphonoacetaldehyde hydrolase
Protein accession	YP_027508
Protein GI	49184256
COG category	[R] General function prediction only
COG ID	[COG0637] Predicted phosphatase/phosphohexomutase
TIGRFAM ID	[TIGR01422] phosphonoacetaldehyde hydrolase [TIGR01509] haloacid dehalogenase superfamily, subfamily IA, variant 3 with third motif having DD or ED [TIGR01549] haloacid dehalogenase superfamily, subfamily IA, variant 1 with third motif having Dx(3-4)D or Dx(3-4)E

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATAG AAGCAGTTAT TTTTGATTGG GCAGGTACGA CAGTTGATTA CGGATGTTTT 
GCACCACTGG AAGTATTTAT GGAGATTTTT CATAAACGAG GTGTGGGAAT TACAGCAGAA 
GAAGCCCGTA AGCCAATGGG ATTATTAAAA ATTGATCATG TAAGGGCACT TACAGAGATG 
CCTCGTATTG CGAATGAATG GAATCGTATT TTCGGACAAT TACCAACAGA AACAGACATT 
CAGGAGATGT ATGAAGAATT TGAAGAGATT CTCTTCGCTA TTTTACCGCG CTATGCGTCG 
CCAATTCATG GAGTAAAAGA AGTGATTGCT TCTTTACGTG AACGAGGAAT TAAAATTGGT 
TCAACGACTG GTTATACGAG AGAAATGATG GACATTGTAG CAAAAGAAGC AGCACTACAA 
GGATATAAAC CTGATTTTCT TGTAACGCCA GATGATGTTC CTGCGGGGCG TCCATATCCG 
TGGATGTGTT ATAAAAATGC GATGGAACTT GGTGTATATC CCATGAATCA TATGATAAAA 
ATTGGAGACA CGGTATCAGA TATGAAAGAG GGAAGAAATG CTGGTATGTG GACAGTTGGT 
GTAATTCTTG GCAGTAGCGA ACTCGGTTTA AGTGAAGAAG AAGTGGAGAA TATGGATCCA 
GCAGAACTTC GTGAAAAAAT AGAAGTAGTT CGCAATCGTT TCGTTGAAAA TGGAGCGCAC 
TTTACGATTG AAACGATGCA GGAACTTGAA AGTGTAATGG AACGTATCGA GAAACAAGAA 
CTTATTATTT CATAA

Protein sequence

MKIEAVIFDW AGTTVDYGCF APLEVFMEIF HKRGVGITAE EARKPMGLLK IDHVRALTEM 
PRIANEWNRI FGQLPTETDI QEMYEEFEEI LFAILPRYAS PIHGVKEVIA SLRERGIKIG 
STTGYTREMM DIVAKEAALQ GYKPDFLVTP DDVPAGRPYP WMCYKNAMEL GVYPMNHMIK 
IGDTVSDMKE GRNAGMWTVG VILGSSELGL SEEEVENMDP AELREKIEVV RNRFVENGAH 
FTIETMQELE SVMERIEKQE LIIS