Gene GM21_2457 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2457
Symbol
ID	8137798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2871363
End bp	2872661
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	62%
IMG OID	644870067
Product	EPSP synthase (3-phosphoshikimate 1-carboxyvinyltransferase)
Protein accession	YP_003022258
Protein GI	253701069
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0766] UDP-N-acetylglucosamine enolpyruvyl transferase
TIGRFAM ID	[TIGR01072] UDP-N-acetylglucosamine 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	166
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACACCG GAATTGTGGC AGAGGTACCC ACAGCGGTTG GTCAGATCGA TACGTCCAGT 
TATGTCGTCC ATCGCTCCAG GCTGGTAGGG ACAGTCAGTG TGAGCGGCGC CAAAAACAGC 
GTGCTGCGGC TTCTGGCGGC CTCTCTTCTG ACCAGCGAGA GCATTGTGCT GAGGAACTAT 
CCGGTCGGCC TGCTCGACGC CAAGGTACAC GTCCAGATGC TTGAAGTGCT GGGAAAAAAC 
TGCGTCTGCG ACGGCGAGGA GATCACCATC ACGCAAGCTG CGGCTCCCCC GTCCCGTCTC 
GACTGGCAGG GACGCTCCAT ACGCAACACC CTTCTCATCC TCGGGGCTTT GGTGGCCCGC 
ACCGGTGAGG GGGCGGTTCC CCTCCCGGGC GGCTGCAAGT TAGGCGAGCG GAAGTACGAC 
CTGCACGAGA TGTTGCTGCA GCGCTTGGGC GCCAAGGTGT GGGAGGAGGA CGGGATGCTC 
TGCGCCCGCT CCACCGGACG CCTGGTCGGG ACCGATATCC ACCTGCCGAT CCGTTCCACC 
GGTGCGACGG AGAACGCCAT TATCTGCGGT ACGCTGGCAA GCGGGGTCAC CAGGATCTGG 
AATCCGCACA TCCGGCCGGA GATACTCGAC CTGATCCACT TGCTGCAGAG CATGGGGGCG 
TCGATCAGGG TGTTCGGACA GGAGCACATA GAGGTGACCG GTGTCGAACA ACTCCACGGC 
GCAAAGCATG TTGTCATCTC GGACAACATG GAGGCGATCA CCTGGCTGAT CGCATCGGTC 
ATCACCGGCG GCGACATTGA GATCTTCAAC TTCCCCTATC GGGACCTGGA GGTCCCCCTC 
ATTCACCTGA GGGAGAGCGG GGCGCGATTC TTCCGCGGCG ACAACAGCCT CATCGTAAGG 
GGGGGGCGTT GCTACCCCGT CGACATCAGC ACCGGTCCGT ATCCGGGCAT AAACTCGGAT 
ATGCAGCCGC TTTTCGCTGT TTACGGAGCG GTGGCGCAGG GGGAGACCCG CGTCATCGAC 
CTCCGTTTCC CGGGACGCTA CGCCTATGCG GAGGAGCTGG CCAAGATGGG GGTCTCCTCT 
GCCATCGACG GGAACCTCCT GAAAATAAGC GGAGGCAGGC CGCTCATCGG CGCGGAAGTG 
CGGGCCCTTG ACCTTCGCGC AGGCATCGCC CTGACCCTGG CCGGACTGGT CGCTGACGGC 
CGGACTGTGC TGCGCGAAGC ATGGCAGGTG GAGCGCGGTT ACAACAACTT CATGCACAAG 
ATGCAGCAGC TTGGAGGAAA CATCTCCTAT GGCTGCTGA

Protein sequence

MNTGIVAEVP TAVGQIDTSS YVVHRSRLVG TVSVSGAKNS VLRLLAASLL TSESIVLRNY 
PVGLLDAKVH VQMLEVLGKN CVCDGEEITI TQAAAPPSRL DWQGRSIRNT LLILGALVAR 
TGEGAVPLPG GCKLGERKYD LHEMLLQRLG AKVWEEDGML CARSTGRLVG TDIHLPIRST 
GATENAIICG TLASGVTRIW NPHIRPEILD LIHLLQSMGA SIRVFGQEHI EVTGVEQLHG 
AKHVVISDNM EAITWLIASV ITGGDIEIFN FPYRDLEVPL IHLRESGARF FRGDNSLIVR 
GGRCYPVDIS TGPYPGINSD MQPLFAVYGA VAQGETRVID LRFPGRYAYA EELAKMGVSS 
AIDGNLLKIS GGRPLIGAEV RALDLRAGIA LTLAGLVADG RTVLREAWQV ERGYNNFMHK 
MQQLGGNISY GC