Gene GM21_1841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1841
Symbol
ID	8137172
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2142939
End bp	2144030
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	60%
IMG OID	644869452
Product	UDP-N-acetylglucosamine 2-epimerase
Protein accession	YP_003021652
Protein GI	253700463
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0381] UDP-N-acetylglucosamine 2-epimerase
TIGRFAM ID	[TIGR00236] UDP-N-acetylglucosamine 2-epimerase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	0.000516167
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACGTCC TTCTTATCGC CGGTGCCAGG CCCAATTTCA TGAAGATCGC TCCTATTTAC 
CGCGCTTCCC TTGGCTATCC CTCGGTCGCA TGCAGCATCG TCCACACAGG ACAGCATTAC 
GACAAGGAGA TGTCCGGCAC CTTCTTCGAT GAACTGGAAA TCCCCGAACC GCGCTATTCG 
CTGAACGTCG GCTCGGGAAG CCATGCGGAG CAAACCGCAG CCATCATGGT CGCCTTCGAG 
GAGGTCTGCC GGCAGGAGTC GCCCGACCTC GTGCTGGTGG TGGGGGACGT GAATTCCACA 
CTTGCCTGCA GCATCGTGGC GAAAAAATGC GGGGTTTCAG TGGCGCACGT CGAGGCCGGA 
TTACGGAGCT TCGACCTGTC CATGCCGGAG GAGATCAACC GCATGGTGAC CGACGCCATA 
TCCGACAGCT TCTTCGTTAC CGAGGAAAGC GGCGTAGAGA ACCTGCTGAG GGAAGGAAAG 
AAACCGGAAC GGATTCATGA GGTGGGGCAT GTCATGATCG ACAACCTGTT GCGCCAGGTG 
AAGCTTCTGG AGGGGATCGA CCCCACGAGC TTCGATAGCC ACCGTCTCAG GAAGGGGGCG 
GGAAGGTACC TCTTTCTCAC CCTGCACCGC CCCTCCAATG TGGACAGCAG GGAGGCGTTC 
GCGGGGATCG CCGAGGCCGT CAACGAGTTG GCCCGTCAAA GGACCATCTT CTTCCCGGTC 
CATCCTCGCA CCAGAAATAT GATGAGCGCG CACGGCATCG AGTTGAGCGA CAAGGTGGTC 
CTACTGCCGC CGCTTGGTTA TCGGGAGGCG CTTTTTCTCT GGAAGGACGC CGAAGCTGTT 
CTTACCGACA GCGGAGGCCT CCAGGAGGAA ACCACCGCGC TGGGGGTCCC GTGCGTGACC 
ATACGGGAGA ACACCGAGCG TCCCGTCACT GTAGAGATCG GGACCAATGT CCTCGCCGGC 
ACAGCACCTG AAAAAATCCT CGCGGGGTAT CGCCTAAGCC TGGAGAAGCG GGGCCGGGCC 
AGGGTGCCGC AGTTGTGGGA CGGCAGGGCC GCCGAGCGCA TCTGGAAGGT ATTGGCTGGA 
GAAAGTCGAT GA

Protein sequence

MNVLLIAGAR PNFMKIAPIY RASLGYPSVA CSIVHTGQHY DKEMSGTFFD ELEIPEPRYS 
LNVGSGSHAE QTAAIMVAFE EVCRQESPDL VLVVGDVNST LACSIVAKKC GVSVAHVEAG 
LRSFDLSMPE EINRMVTDAI SDSFFVTEES GVENLLREGK KPERIHEVGH VMIDNLLRQV 
KLLEGIDPTS FDSHRLRKGA GRYLFLTLHR PSNVDSREAF AGIAEAVNEL ARQRTIFFPV 
HPRTRNMMSA HGIELSDKVV LLPPLGYREA LFLWKDAEAV LTDSGGLQEE TTALGVPCVT 
IRENTERPVT VEIGTNVLAG TAPEKILAGY RLSLEKRGRA RVPQLWDGRA AERIWKVLAG 
ESR