Gene Athe_1994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1994
Symbol
ID	7408208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	2103828
End bp	2104925
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	37%
IMG OID	643716370
Product	D-isomer specific 2-hydroxyacid dehydrogenase NAD-binding
Protein accession	YP_002573854
Protein GI	222529972
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0111] Phosphoglycerate dehydrogenase and related dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAAA AAATGAAAAT AATGGTAATT GGAGACGCAA TGATACCGGG TAAAGATTTT 
GAATCAGCAG CTAAAAAATA TTTATCTGAT TATGTGGAAG AAATAATTAC AGGAGATTGG 
GAAAATAATT GGGACAATTT ACAAAGAAGA AGATTGGAAG TAGAAAAGAA AGGGCCCGAG 
ATTGAGGAAG TAGTTCCTTT AATAAAGGAA AAAGGGCAAG ATGTTTCAAT GTTGTTTGGT 
TTATTTGTTC CCATTTCCAA AGAAACATTC AATTACTTGC CAAAGGTAAA GATTATTGGG 
GTTTCGCGAG CAGGCTTAGA AAATGTAAAC GTAAAAGAAG CAACCCAACG AGGAGTTTTA 
GTGTTCAATG TCCAGGGAAG AAATGCAGAA GCTGTTTCTG ACTTTGCAAT AGGTTTGCTT 
TTGGCAGAAT GTAGAAACAT TGCGAGAGCC CACTATGCAA TAAAGAATGG CCAGTGGCGG 
AAAGAATTTT CTAATTCTGA TTGGATTCCG GAACTAAAAG GCAAAACAGT TGGTATTATT 
GGTTTTGGAT ATATTGGTAG ACTGGTAGCA AAAAAACTCT CTGGATTTGA AGTTAGAAGA 
CTTGTGTACG ATCCTTATGT AAGTGAAGAG GAAATTAGAG AATGCGGATG TATACCAGTA 
GACAAAGAGA CTTTGTTCAA AGAAAGTGAT TTTATTACTC TCCATGCACG CCTCACAGAA 
GAGAATAAAA ATTTGGTTGG CAAATATGAG ATTTCATTGA TGAAACCAAC AGCATACATT 
ATTAACACTG CACGGGCAGG TCTAATTGAT AAAGAAGCAT TAATAGAGGC TCTAAAGACA 
AAGAGAATAG CAGGAGCAGC ACTGGATGTG TTCTGGGAAG AACCTATTCC TTCGGACAGT 
GAGTTGTTAG AATTGGACAA TGTTACTCTT ACAAGTCATT TAGCAGGAAC AACCAAAGAA 
GCACTTACAA GATCACCTGA GCTTTTAATG GAGGATGTCA AGAAGTTTAT TGAAGGGCAG 
AAAGCAAGAT TTATTGTGAA TCCAGAGGTT TTGGAAAACC AAGAGTTCAA GAAATGGCTG 
GAGGGTGTGA AGAAATGA

Protein sequence

MSKKMKIMVI GDAMIPGKDF ESAAKKYLSD YVEEIITGDW ENNWDNLQRR RLEVEKKGPE 
IEEVVPLIKE KGQDVSMLFG LFVPISKETF NYLPKVKIIG VSRAGLENVN VKEATQRGVL 
VFNVQGRNAE AVSDFAIGLL LAECRNIARA HYAIKNGQWR KEFSNSDWIP ELKGKTVGII 
GFGYIGRLVA KKLSGFEVRR LVYDPYVSEE EIRECGCIPV DKETLFKESD FITLHARLTE 
ENKNLVGKYE ISLMKPTAYI INTARAGLID KEALIEALKT KRIAGAALDV FWEEPIPSDS 
ELLELDNVTL TSHLAGTTKE ALTRSPELLM EDVKKFIEGQ KARFIVNPEV LENQEFKKWL 
EGVKK