Gene Moth_2387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2387
Symbol
ID	3832026
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2509738
End bp	2510913
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	62%
IMG OID	637830306
Product	UDP-N-acetylglucosamine 2-epimerase
Protein accession	YP_431212
Protein GI	83591203
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0381] UDP-N-acetylglucosamine 2-epimerase
TIGRFAM ID	[TIGR00236] UDP-N-acetylglucosamine 2-epimerase

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0541306
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCTT ATAAGATACT CACCGTCTTC GGCACCAGGC CCGAGGCTAT TAAGATGGCC 
CCGGTGGTCA AAGAACTCAA TCTCCACCCC GAGGAGTTTA CCTGTCTGGT GGCAGTCACG 
GCCCAGCATC GAGAGATGCT CGACCAGGTC CTGCGCCTCT TCCATATCAA ACCCGATTAC 
GACCTGGATA TTATGCGGCC ACGCCAGACC CTGGAGGAGA TTACCACCAG GGCCCTGACC 
GGCCTGGCCG GGGTTCTCAA AGAGGCCCGC CCGGACCTGG TCCTGGTCCA CGGCGACACC 
ACCACCACCT TTGTCGCCGC CCTGGCGGCC TTTTACCAGC AGATACCCGT CGGCCATGTC 
GAGGCGGGCC TAAGGACCGG CGACCGCTAT GCCCCCTTTC CCGAGGAAAT GAATCGCCGC 
CTGGCCGGGG TACTGACCGA CATCCACTTC GCGCCCACAG CCAAGGCCCG GGACAATCTC 
CTCCGCGAAG GCATAGCTCC GGAGCATATC TATGTCACCG GTAACACGGT CATCGACGCC 
TTAAAAGCCA CCATCCGGGA AGAATACCAG TTTGGAGACC ACGGCCTGGC GGGGCTGGAC 
TTACGGGAAA AGCGGGTCAT CCTGGTGACG GCCCACCGGC GGGAGAACTG GGGCGAACCC 
CTTAAGGAGA TCTTTACGGC TCTGCGGGAT TTAATCCGGC GCCATCCCGA CACAGCCCTG 
ATTTTTCCCG TTCACTATAA CCCGCGGGTC CGGCAACTGG CCCGGGAGGT CCTCGGCGGC 
CAGGAGCGGG TTTATTTAAT CGAACCCCTT GATTACGAGC CCTTTGTCAA CCTCATGAAC 
CGAGCCTATC TGGTCCTGAC GGATTCCGGC GGCCTGCAGG AAGAAGCCCC GGCCCTGGGC 
AAGCCCGTGC TGGTCCTGCG GGAGGTTACG GAACGGCCGG AAGCCGTAGC CGCCGGCACC 
GTCCGCCTGG TGGGCACCGC CTACCGTGAC ATCCTGGCGG CGGCGGAGGA ACTCCTGACT 
GACAGGCAGG CTTACCTGCA AATGGCCCAC GCCGTCAACC CTTATGGTGA CGGCCAGGCC 
TCCCGGCGCA TTCGCAGCGC CCTCCGCCAT TACTTCGGAA TGACTGTTGC CCGGCCCCAG 
GAATTTCAAC CCTTGGGGGC AACCGGACAA AAATAA

Protein sequence

MPPYKILTVF GTRPEAIKMA PVVKELNLHP EEFTCLVAVT AQHREMLDQV LRLFHIKPDY 
DLDIMRPRQT LEEITTRALT GLAGVLKEAR PDLVLVHGDT TTTFVAALAA FYQQIPVGHV 
EAGLRTGDRY APFPEEMNRR LAGVLTDIHF APTAKARDNL LREGIAPEHI YVTGNTVIDA 
LKATIREEYQ FGDHGLAGLD LREKRVILVT AHRRENWGEP LKEIFTALRD LIRRHPDTAL 
IFPVHYNPRV RQLAREVLGG QERVYLIEPL DYEPFVNLMN RAYLVLTDSG GLQEEAPALG 
KPVLVLREVT ERPEAVAAGT VRLVGTAYRD ILAAAEELLT DRQAYLQMAH AVNPYGDGQA 
SRRIRSALRH YFGMTVARPQ EFQPLGATGQ K