Gene GM21_3802 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3802
Symbol
ID	8139176
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4373383
End bp	4374648
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	64%
IMG OID	644871421
Product	UDP-N-acetylglucosamine 1-carboxyvinyltransferase
Protein accession	YP_003023579
Protein GI	253702390
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0766] UDP-N-acetylglucosamine enolpyruvyl transferase
TIGRFAM ID	[TIGR01072] UDP-N-acetylglucosamine 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	116
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAAAAAC TGGTAATTAA AGGTGGCAAC AAGCTCTCCG GAGAAGTGAC CGTTAGCGGA 
TCCAAGAACG CTGCCCTCCC CATATTCATC TCCACCATCC TGGCTCCGGG ATGCCACACC 
ATCAGCAACG TTCCCTTCCT TAGGGACATC AACACCACCA TCAAGGTGCT GGAGAAGCTG 
GGGGCGACGG TCGACGGCAG GGGGAACGTG GTCAAGATCG ACACCACCAA CCTGAACAGC 
TTCGAGGCGA CCTACGACCT GGTGCGCACC ATGCGCGCCT CGGTCCTCGT GCTCGGCCCG 
CTCCTGGCGC GCTTCGGCCA GGCCCGCGTC TCGCTTCCGG GGGGATGCGC CATAGGCGCC 
CGCCCGATCA ACCTGCACCT CAAAGGGCTA GCGGCGCTGG GCGCCGAGAT CACCCTGGAG 
CACGGCTACG TCGAGGCGAA GGCGAAAAAG CTCAAGGGGG CGCGCATCAA CTTCGACATC 
TCCACCGTCG GCGGCACCGA GCAGCTCCTG ATGGCGGCGG CCACGGCGCA GGGGGAGACC 
GTTCTGGAGA ACGCGGCGCG TGAGCCGGAG ATCGTCGATC TCGCCGAGAT CCTGATCAAG 
ATGGGGGCAG ACATCGAGGG GGCCGGCACC GACACCATCC GCATCAAGGG GGTCGAGGCG 
CTCACCGCCG CCGAGCACGC CGTGATGCCG GACCGCATCG AGGCCGGGAC CTTCATGATC 
GCATCCGCCA TCACCGGCGG CGATATCAAG ATCAAGAACA TGCGTCTGGA CCACCTGGAC 
GCACTCTCCT TCAAACTGCA GGACGCCGGC GTCGAGATCA CCAACAAGGA CAACATGGTC 
CGCGTCAAAG GCCCCAAGAA GATCCGGAAC GTGAACATCA AGACGAGACC GTACCCCGGT 
TTTCCGACTG ACATGCAGGC CCAGTTCATG GCGCTCATGT GCATCGCCGA GGGGGCCAGC 
GTCATCTCGG AGAACATCTT CGAGAACCGC TTCATGCACG TCTCCGAGCT GCTTCGCTTC 
GGCGCCGACA TCATCTGCGA GGGGAACAGC GCCACGGTGA AGGGGGTCAA GAAGCTCTCC 
GGGGCTCCGG TCATGGCCAC CGACCTGCGC GCCTCCGCGT CGCTGATTCT GGCAGCCCTC 
GCCGCCGACA ACACCAGCGA GATCTCCAGG ATCTACCACC TGGACCGCGG CTACGAAAGC 
ATCGAGAAGA AGCTCGCCGG TCTCGGCGCC GACATAGCCC GCGTCCCGGA CGAAGAAGGC 
CCCTAG

Protein sequence

MEKLVIKGGN KLSGEVTVSG SKNAALPIFI STILAPGCHT ISNVPFLRDI NTTIKVLEKL 
GATVDGRGNV VKIDTTNLNS FEATYDLVRT MRASVLVLGP LLARFGQARV SLPGGCAIGA 
RPINLHLKGL AALGAEITLE HGYVEAKAKK LKGARINFDI STVGGTEQLL MAAATAQGET 
VLENAAREPE IVDLAEILIK MGADIEGAGT DTIRIKGVEA LTAAEHAVMP DRIEAGTFMI 
ASAITGGDIK IKNMRLDHLD ALSFKLQDAG VEITNKDNMV RVKGPKKIRN VNIKTRPYPG 
FPTDMQAQFM ALMCIAEGAS VISENIFENR FMHVSELLRF GADIICEGNS ATVKGVKKLS 
GAPVMATDLR ASASLILAAL AADNTSEISR IYHLDRGYES IEKKLAGLGA DIARVPDEEG 
P