Gene Tmz1t_1123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_1123
Symbol
ID	7084652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	1231052
End bp	1232158
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	62%
IMG OID	643698138
Product	UDP-N-acetylglucosamine 2-epimerase
Protein accession	YP_002354778
Protein GI	217969544
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0381] UDP-N-acetylglucosamine 2-epimerase
TIGRFAM ID	[TIGR00236] UDP-N-acetylglucosamine 2-epimerase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.362937
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGCTG AGTATCTGGT CGACATTATT GCAGGCGCGC GCCCCAATTT TATGAAGATC 
GCGCCGATTA TTCGTGCGTT CGAGGCCCGC AAGGCAGCGG GTGGTGCGCT GCGGTTTCGC 
CTGATCCACA CCGGCCAGCA TTACGATCCG CGCATGTCGG GCGAGTTTTT CCGTCAACTC 
GGCATTCCCG AGCCCGATGT GAACCTGGAG GTGGGTTCGG GCACTCAAGC GGAGCAGACC 
GGCGCGATCA TGTCGCGTTA CGAGGCGCTG CTGCTGGAGA AGCCCAGCAA TCTTTGCCTG 
GTGGTGGGCG ACGTCACGTC GACCATGGCG TGCGCGATCG CCGCGCAGAA GCTGCGCATT 
CCGGTGGCGC ACGTGGAGGC GGGTATCCGT TCGGGCGACT GGACGATGCC GGAAGAGATC 
AACCGCATGG TGACGGATTC GATCACCAAC TGGTTTTTCA CGACCAGCGA GGTGGCGAAT 
GAAAACCTGC GCCGCACCGG GGTGAGCGAC GATCGGATCT TCTTCGTCGG CAACACCATG 
ATCGACACGC TGCTGGTAAA TCTGCCGCGC CTGCAGAAGC CGGAGTTCTG GGACGAGCTT 
GGTCTGAAGG CGGGCGAGTA TTTCGTTGTG ACGCTGCATC GGCCGGCCAA CGTGGATAAG 
GGCCATGGTT TCGCCCGCCT GCTGGCGGCG ATCGGCGAAG GTACGCGCGG CTTGCCGGTG 
GTGTTCCCGG TTCATCCGCG TACGGCAAAG ACGCTGCGGG ATTTGAATGA GGTTCCGGCC 
AATTTCCGCC TGGTCGATCC GCAGCCTTAT CTTGAATTCA ACTATCTGGT GAAGAACGCC 
AAGGCGGTGA TCACCGATTC GGGCGGCATC ACCGAAGAGA CGACGGTGAT GGGCGTGCCC 
TGCATGACCT TGCGCGACAA CACCGAGCGC CCGGAAACGG TGACGACCGG CACCAACGAG 
CTGATCGGCA CCAACCCCGA TGCGCTGGCG CCGGCATTGG AGAAACTGTT TGCCGGGCAG 
TGGAAGAAGG GCGGCATTCC GCCGCTGTGG GATGGCAAGA CGGGCGAGCG CATCGTCGCC 
GAGCTTGAAA GGCTGCTTGT CGCATGA

Protein sequence

MAAEYLVDII AGARPNFMKI APIIRAFEAR KAAGGALRFR LIHTGQHYDP RMSGEFFRQL 
GIPEPDVNLE VGSGTQAEQT GAIMSRYEAL LLEKPSNLCL VVGDVTSTMA CAIAAQKLRI 
PVAHVEAGIR SGDWTMPEEI NRMVTDSITN WFFTTSEVAN ENLRRTGVSD DRIFFVGNTM 
IDTLLVNLPR LQKPEFWDEL GLKAGEYFVV TLHRPANVDK GHGFARLLAA IGEGTRGLPV 
VFPVHPRTAK TLRDLNEVPA NFRLVDPQPY LEFNYLVKNA KAVITDSGGI TEETTVMGVP 
CMTLRDNTER PETVTTGTNE LIGTNPDALA PALEKLFAGQ WKKGGIPPLW DGKTGERIVA 
ELERLLVA