Gene BAS0641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS0641
Symbol
ID	2849808
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	693271
End bp	694323
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	38%
IMG OID	637503882
Product	alcohol dehydrogenase, zinc-containing
Protein accession	YP_026918
Protein GI	49183666
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCAT TACTTTGGCA TAATCAACGT GATGTAAGAG TAGAAGAAGT ACCAGAACCA 
ACTGTAAAAC CAGGAGCAGT TAAGATTAAA GTTAAATGGT GTGGTATCTG CGGGACAGAC 
TTGCATGAAT ATTTAGCAGG ACCTATTTTT ATTCCGACAG AAGAGCATCC ATTAACACAT 
GTAAAAGCAC CGGTTATTTT AGGTCATGAG TTTAGCGGTG AGGTAGTTGA AATCGGTGAA 
GGCGTTACAT CTCATAAAGT GGGAGACCGC GTCGTTGTAG AACCAATTTA TTCTTGTGGT 
AAATGTGAAG CTTGTAAACA TGGACATTAC AATGTTTGTG AACAACTTGT TTTCCACGGT 
CTTGGCGGAG AAGGCGGCGG TTTCTCTGAA TATACAGTAG TACCAGAAGA TATGGTTCAC 
CATATTCCAG ATGAAATGAC GTATGAACAA GGTGCTCTTG TAGAACCAGC AGCAGTAGCG 
GTTCATGCAG TACGTCAAAG TAAATTAAAA GAAGGGGAAG CAGTAGCAGT CTTTGGTTGT 
GGTCCAATTG GACTTCTTGT TATCCAAGCA GCTAAAGCAG CAGGAGCAAC TCCTGTTATT 
GCAGTTGAAC TTTCTAAAGA ACGTCAAGAG TTAGCAAAAT TAGCAGGTGC GGATTACGTA 
TTGAATCCAG CGACTCAAGA TGTATTAGCT GAAATTCGCA ACTTAACAAA TAGTTTAGGT 
GTAAATGTAA GCTTTGAAGT AACTGGTGTT GAAGTAGTAC TTCGTCAAGC AATTGAAAGC 
ACAAGCTTTG AAGGACAAAC TGTAATTGTT AGTGTATGGG AAAAAGACGC AACAATTACT 
CCAAATAATC TTGTACTAAA AGAAAAAGAA GTGGTTGGTA TTTTAGGATA CCGTCATATC 
TTCCCAGCTG TTATTAAATT AATTAGCTCT GGTCAAATTC AAGCAGAGAA ATTAATTACG 
AAAAAAATCA CAGTAGATCA AGTTGTTGAA GAAGGATTTG AAGCACTTGT AAAAGATAAA 
ACACAAGTGA AAATTCTTGT TTCACCTAAA TAA

Protein sequence

MKALLWHNQR DVRVEEVPEP TVKPGAVKIK VKWCGICGTD LHEYLAGPIF IPTEEHPLTH 
VKAPVILGHE FSGEVVEIGE GVTSHKVGDR VVVEPIYSCG KCEACKHGHY NVCEQLVFHG 
LGGEGGGFSE YTVVPEDMVH HIPDEMTYEQ GALVEPAAVA VHAVRQSKLK EGEAVAVFGC 
GPIGLLVIQA AKAAGATPVI AVELSKERQE LAKLAGADYV LNPATQDVLA EIRNLTNSLG 
VNVSFEVTGV EVVLRQAIES TSFEGQTVIV SVWEKDATIT PNNLVLKEKE VVGILGYRHI 
FPAVIKLISS GQIQAEKLIT KKITVDQVVE EGFEALVKDK TQVKILVSPK