Gene Tmz1t_1116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_1116
Symbol
ID	7084645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	1220586
End bp	1221863
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	64%
IMG OID	643698131
Product	nucleotide sugar dehydrogenase
Protein accession	YP_002354771
Protein GI	217969537
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0677] UDP-N-acetyl-D-mannosaminuronate dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.416504
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACACCC TCGACACCCT CAAGCTCGCC ATCATCGGCC TCGGTTACGT CGGCCTGCCG 
CTCGCGGTCG AATTCGCCAA GAAGCGCTCC GTCGTCGGCT TCGACATCAA CCAGGCCCGC 
ATCGACGCCC TCAAGACCGG CCACGACGCC ACCCTCGAGG TCTCCGACGA AGAACTGCGC 
GAAGCCACCG GCCTGCAATA CAGCGCCAAC CTGCAGGACC TCGCCGCCTG CAACACCTTC 
ATCGTCACCG TCCCCACCCC CATCGACGAG CACAAGCAGC CCGACCTCAC CCCGCTGGTC 
AAGGCCAGCG AGACCATCGG CAAGGTGCTC AAGAAGGGCG ACATCGTCAT CTACGAATCC 
ACGGTCTACC CCGGCGCCAC TGAGGAAGAC TGCGTCCCGG TGCTGGAGAA GTTTTCCGGC 
CTCAAATTCA ACGTCGACTT CTACGCCGGC TACAGCCCCG AGCGCATCAA CCCGGGCGAC 
AAGGAACACC GCGTCTCCAC CATCAAGAAG GTCACCTCCG GCTCCACCCC CGAAGTGGCC 
GAGCTGGTCG ACCAGCTCTA CCGCCAGATC ATCGTCGTCG GCACCCACAA GGCCGAAAGC 
ATCAAGGTGG CCGAAGCCGC CAAGGTCATC GAGAACACCC AGCGCGACGT CAACATCGCC 
CTCATCAACG AGCTGGCCAT CATCTTCAAC AAGATGGGCA TCGACACCGA GGCCGTGCTG 
CAGGCCGCCG GCAGCAAGTG GAACTTCCTG CCCTTCCGTC CGGGCCTGGT CGGCGGCCAC 
TGCATCGGCG TGGACCCCTA CTACCTCACC CACAAGGCGC AGTCCATCGG CTACCACCCC 
GAGATCATCC TCGCCGGCCG CCGCCTCAAC GACGGCATGG GCGCCTACGT GGTGTCGCAG 
CTCGTCAAGG CCATGCTCAA GCGCCGCATC ACCGTCGAAG GCGCGCGCGT GCTGGTCATG 
GGCCTCACCT TCAAGGAAAA CTGCCCGGAC CTGCGCAACA CCCGCATCGT CGACATCGTC 
AAGGAACTCG GCGAGTACAA CATCCAGGCC GACGTGTACG ACCCGTGGGT GGACGTGGCC 
GAGGCCCAGC ACGAATACGG GCTCACTCCG ATCGACAAGC CGGAGCCCGG CGCCTACGAC 
GCGATCATCG TCGGCGTGGC GCATCAGCAG TTCAAGGACA TGGGAGCCGA GGCCATCCGC 
GCGCTCGGCA AGCCGGAACA TGTGGTGTAT GACCTCAAGT ATGTGATGCC GAGGAATGCG 
GCGGATCTGC GACTTTAA

Protein sequence

MHTLDTLKLA IIGLGYVGLP LAVEFAKKRS VVGFDINQAR IDALKTGHDA TLEVSDEELR 
EATGLQYSAN LQDLAACNTF IVTVPTPIDE HKQPDLTPLV KASETIGKVL KKGDIVIYES 
TVYPGATEED CVPVLEKFSG LKFNVDFYAG YSPERINPGD KEHRVSTIKK VTSGSTPEVA 
ELVDQLYRQI IVVGTHKAES IKVAEAAKVI ENTQRDVNIA LINELAIIFN KMGIDTEAVL 
QAAGSKWNFL PFRPGLVGGH CIGVDPYYLT HKAQSIGYHP EIILAGRRLN DGMGAYVVSQ 
LVKAMLKRRI TVEGARVLVM GLTFKENCPD LRNTRIVDIV KELGEYNIQA DVYDPWVDVA 
EAQHEYGLTP IDKPEPGAYD AIIVGVAHQQ FKDMGAEAIR ALGKPEHVVY DLKYVMPRNA 
ADLRL