Gene Athe_2334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2334
Symbol
ID	7407753
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2475909
End bp	2477009
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	40%
IMG OID	643716698
Product	oxidoreductase domain protein
Protein accession	YP_002574177
Protein GI	222530295
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAAGC TTAAGTTTGC TATTGCGGGC TGTGGGGTTA TATCAAAGAC ACATGCGATT 
GCTATTTCAG CTCTTTCAAG TGATGCGGAG CTTGTTGCTG TGTGCGATGT TATAGAAGAC 
AGAGCAAGAA AACTTGCCCA AGATTTTGGT GTGAAAAAGA TATATACTGA TTATGAAAAA 
ATGCTTCTTG ATTCTGATAT AGATGTTATT TCAATCTGCA CACCATCTGG TATGCATGCT 
GATATGGCAG CTTTAGCAGC CGATAGCAAA AAACATGTCA TTGTTGAAAA GCCCATGGAT 
ATAACATTGT CTAAAGCTGA CAGAATAATA GAAGCTCAAA ACAGGAACAA TGTGGTGATT 
TCTATAATTT CACAGCACAG ATACAGCGAT TGTATGCAAC TTTTAAAAAG GCTCATGAAT 
GAAGGAAAGT TTGGCAACAT AGTTTTAGCA ACAAGCTACA CTAAATGGTA CAGGTCGCAA 
GAGTATTATG ACAGTGGTGA CTGGCGTGGG ACATGGAACT TGGACGGTGG CGGTGCGCTC 
ATGAACCAAT CAATACATTA CATAGACATG ATCCAGTGGA TTGTTGGAAA GGTTGTGGAG 
GTTTTTGCCT ATTGCACAAC AAGAGCACAT AAGCGGATAG AAGTTGAAGA TGGTGCTGTG 
GCTTGTGTCA AGTTTGAAAA TGGTGCGATA GGCGAGATAG TTGGAACAAC AAGTGCATAT 
CCCGGTTTTG AAACGCGGCT TGAGATTTTT GGTGAACATG GTTCTGCAAT AGCTGTTAAC 
ACCCAGCTTG AAAGTCTTTA CTTCAAAGAT GGGTCTGAGA AGGAGTATTT GGAGAGTTAT 
AAAAAGGATG ACAGAGGTCC TGTTGGTGCA TCTTCTGCCG CCATCAAAGA AGAAGGACAT 
GTAAGACAGT ACAGAGATGT AATAAATGCT ATAAAAACCG GAACAAAACC ACTTATCCCC 
GCTGAGGAAG GTAGACATCC TGTTGAAATT ATACTTGCCA TTTACCTCTC AAGCTTGACA 
GGAAGACCTG TAAAACTTCC TCTTGAAAGT GATGAGGAGG TTTTAAAAGA GATTGAAAAG 
ATAAAAGGCA AAGGATTTTG A

Protein sequence

MSKLKFAIAG CGVISKTHAI AISALSSDAE LVAVCDVIED RARKLAQDFG VKKIYTDYEK 
MLLDSDIDVI SICTPSGMHA DMAALAADSK KHVIVEKPMD ITLSKADRII EAQNRNNVVI 
SIISQHRYSD CMQLLKRLMN EGKFGNIVLA TSYTKWYRSQ EYYDSGDWRG TWNLDGGGAL 
MNQSIHYIDM IQWIVGKVVE VFAYCTTRAH KRIEVEDGAV ACVKFENGAI GEIVGTTSAY 
PGFETRLEIF GEHGSAIAVN TQLESLYFKD GSEKEYLESY KKDDRGPVGA SSAAIKEEGH 
VRQYRDVINA IKTGTKPLIP AEEGRHPVEI ILAIYLSSLT GRPVKLPLES DEEVLKEIEK 
IKGKGF