Gene GBAA_5079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GBAA_5079
Symbol
ID	2816607
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. 'Ames Ancestor'
Kingdom	Bacteria
Replicon accession	NC_007530
Strand	-
Start bp	4599613
End bp	4600623
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	39%
IMG OID	637791743
Product	aldo/keto reductase family oxidoreductase
Protein accession	YP_021727
Protein GI	47530378
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGATT TATTAAAAGG TACACTTGGT TTTGGTACGG CACCACTAGG TAATATGTAC 
CGTAATATTC CAGAAGAAGA AGCAATCGCA ACAGTGGATG CTGCTTGGGA TAATGGTGTG 
CGTTACTTTG ATACAGCTCC ACTTTATGGA TCTGGTTTAG CAGAGATTCG TCTTGGTGAA 
GCATTATCGA AAAGAAATCG TGATGAGTAC TTCTTAAGTA CAAAAGTAGG TCGAATTATT 
TCAGATGAAT TGGAAGATCC ATCTACACGT GATTTAGGTG AAAAAGGCGG ACTTTTCGAA 
TTTGGTCGTA AAAATAAAAT TATCAATGAC TACAGTGCGG ACGCAACTCT CCGTTCTATT 
GAAGATAGTT TAAAATGTTT AAAAACAGAT CGTCTAGATT TTGTTTATAT TCATGACGTA 
GCACAAGATT TTTATGGAGA TGAGTGGATT TCACAATTTG AGATTGCTCG AACAGGAGCA 
TTCCGTGCAC TTACTCAATT GCGTGATGAA GGTGTAATTA AAGGCTGGGG CCTTGGAGTA 
AATAAAGTAG AGGCTATTGA ACTTATGCTG GACTTAGAAG AAGCAAAACC AAATGTTTCT 
TTACTAGCTG GTCGCTATTC ATTATTAGAC CACGAGCGTG CGTTAGAACG CGTAATGCCT 
GCGGCTGTAA AAAACAATAT GGACATTGTT GTTGGTGGAC CATATAGCTC AGGTGTTCTT 
GCTGGAGGTA CTCACTTCGA ATACCAAAAA GCATCACCAG AAATTATTGC AAAAGTTAAT 
AAAATGAAAA ACCTTGCAGA TCGTCATGGA ATCAGTATTA AAGCTGCTGC TTTACAATTT 
GCATTGGCTA ATCCAGCAGT TGCAGCTGTT ATTCCTGGTG CAAGTAAACC GGAACGAATT 
GCAGAAGACC AAGCTGCATT GAAAACAGTG ATTCCAGCAG CATTCTGGGA AGAAATGCGT 
GAACAAAAAT TAGTTGCAGT TAATGCGCCA CTACCAATTA ACGTTAAATA A

Protein sequence

MKDLLKGTLG FGTAPLGNMY RNIPEEEAIA TVDAAWDNGV RYFDTAPLYG SGLAEIRLGE 
ALSKRNRDEY FLSTKVGRII SDELEDPSTR DLGEKGGLFE FGRKNKIIND YSADATLRSI 
EDSLKCLKTD RLDFVYIHDV AQDFYGDEWI SQFEIARTGA FRALTQLRDE GVIKGWGLGV 
NKVEAIELML DLEEAKPNVS LLAGRYSLLD HERALERVMP AAVKNNMDIV VGGPYSSGVL 
AGGTHFEYQK ASPEIIAKVN KMKNLADRHG ISIKAAALQF ALANPAVAAV IPGASKPERI 
AEDQAALKTV IPAAFWEEMR EQKLVAVNAP LPINVK