Gene Athe_0856 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0856
Symbol
ID	7407431
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	953005
End bp	954096
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	40%
IMG OID	643715234
Product	mannonate dehydratase
Protein accession	YP_002572744
Protein GI	222528862
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1312] D-mannonate dehydratase
TIGRFAM ID	[TIGR00695] mannonate dehydratase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTTTTA AGATGACATT TAGGTGGTTT GGACCAAAGG ATGACAATAT TCCTCTTGAG 
TATATACGTC AGATTCCAGG CATATATGGT GTTGTGACAG CGCTTTTTGA TATTCCAGTT 
GGAGAGGTAT GGCCAGAAGA TAGGATTTTT GAGCTAAAAA AAATGGTAGA AGGTGCAGGG 
CTTAAGTTTG AGGTAATAGA AAGCGTAAAT GTCCATGAGG ACATAAAACT TGGTCTTCCA 
AGTCGAGATA GGTATATAGA AAACTATAAA CAGACCATAA GGAACTTAGC AAAAGCGGGA 
GTAAAGGTAA TATGCTATAA CTTTATGCCT GTATTTGACT GGCTGAGGAC AGACCTTGCA 
AAAAAGCTCC CTGATGGTTC TGAGGTTATG GAATATAACC ATGAGATACT TAAAAATATG 
ACACCAGATG AACTTGTAAA AAGCATGGAA AGGGGCTCAC AAGGATTTTC TCTTCCTGGT 
TGGGAGAGCT ACAGGTTAAA ACAGCTCCAG AGCCTGTTTG AGATGTACAA AGATGTTGAT 
GAGAATAAGC TTTTGCAAAA TCTTATCTAC TTTTTGGAGA ATATAATTCC TGTGTGTGAG 
CAGTGCGATG TTAAAATGGC AATACACCCA GATGATCCAC CGTGGTCACT TTTTGGTCTT 
CCAAGGGTTG TAACAAACAA GGAAAATATA GAAAAGTTTT TAAAAGCGGT TGATAGTCCG 
TACAATGGGT TGACTTTGTG CACAGGGTCG CTTGGAGCAA ACAGGGAAAA CAACATTCCG 
GAGCTTATAA GGTATTTTGG CAAAATGGGA AGAATACATT TTATGCATGT GAGAAATATA 
AAATTTACAG GTGAGAGGTC TTTTTACGAA ACATCCCACC TGTCGACAGA TGGTTCATTT 
GACATGTTTG AGATTATGAA GGCTATATAC GACATAGGTT TTGACGGGTA TATGCGACCT 
GACCATGGAA GGATGATTTG GGGCGAAAAA GGGAGACCTG GTTATGGACT TTATGATAGA 
GCACTTGGCA TTGCGTATTT GAACGGGCTG TGGGAGGCAA TTGACAAGAT GTCAAGAAAT 
GAGAAAAAGT AG

Protein sequence

MGFKMTFRWF GPKDDNIPLE YIRQIPGIYG VVTALFDIPV GEVWPEDRIF ELKKMVEGAG 
LKFEVIESVN VHEDIKLGLP SRDRYIENYK QTIRNLAKAG VKVICYNFMP VFDWLRTDLA 
KKLPDGSEVM EYNHEILKNM TPDELVKSME RGSQGFSLPG WESYRLKQLQ SLFEMYKDVD 
ENKLLQNLIY FLENIIPVCE QCDVKMAIHP DDPPWSLFGL PRVVTNKENI EKFLKAVDSP 
YNGLTLCTGS LGANRENNIP ELIRYFGKMG RIHFMHVRNI KFTGERSFYE TSHLSTDGSF 
DMFEIMKAIY DIGFDGYMRP DHGRMIWGEK GRPGYGLYDR ALGIAYLNGL WEAIDKMSRN 
EKK