Gene Smed_0206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0206
Symbol
ID	5321037
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	233241
End bp	234533
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	65%
IMG OID	640789140
Product	UDP-N-acetylglucosamine 1-carboxyvinyltransferase
Protein accession	YP_001325900
Protein GI	150395433
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0766] UDP-N-acetylglucosamine enolpyruvyl transferase
TIGRFAM ID	[TIGR01072] UDP-N-acetylglucosamine 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCGCA TCAGGATTGT AGGCGGAAAT GAACTCCACG GGGTGATCCC CATCTCCGGC 
GCGAAGAACG CCGCCTTGCC GCTGATGATC GCGTCGCTCC TGACCGATGA CACGCTGACG 
CTCGAAAATG TGCCGCATCT CGCCGATGTC GAGCAATTGA TCCGCATCCT CGGCAATCAT 
GGTGCCGACA TTTCCGTCAA TGGCCGGCGC GAGCGTCAGG GCGAGAGCTA CGCCCGCACG 
GTCCATTTCA CCAGCCGCAA CATCGTTTCG ACGACTGCAC CCTATGAGCT CGTCTCGAAG 
ATGCGCGCGA GCTTCTGGGT CATCGGGCCG CTGCTCGCGC GTGAGGGCAG GGCGCGCGTG 
TCGCTGCCCG GCGGTTGCGC CATCGGAACG CGCCCGGTTG ATCTCTTCAT CGAGGGGCTG 
ACCGCGCTTG GCGCCAGCAT TGAGATCGAC GGCGGCTACG TCAATGCAAC GGCACCGGCG 
GGCGGGCTCA TCGGCGGGCG TTACACCTTC CCGAAAGTTT CCGTCGGCGC GACCCATGTG 
CTGATGATGG CGGCAACGCT TGCCAATGGC ACGACGGTGC TCGGCAACGC CGCGCGTGAG 
CCCGAAGTGG TGGACCTTGC CAAATGCCTG AACGCCATGG GCGCGAAGAT CAGCGGCCAG 
GGGACGAGCA CGATCACCAT CGAGGGCGTG CGCTCGCTCT CGGGCGCCCG CCACCGGGTG 
CTGCCCGATC GCATCGAGAC AGGGACCTAT GCGATGGCCG TCGCCATGGC GGGCGGCGAC 
GTCATTCTCG AAGACACCGA GGCGAGCCTC CTCGATACAG CGCTTGAAGC GATCCGCCGC 
GCCGGCGCCG AGATCAGCGA CACGAACAAC GGCATCCGGA TCGTCCGCAA CGGCGCCGGC 
ATCAGGCCGG TCGACATCGT CACCGATCCC TTCCCCGGCT TCCCGACCGA CCTTCAGGCG 
CAGTTCATGG GGTTGATGAC CCGGTCAAGC GGCGTTTCCC ACATCACCGA GACGATCTTT 
GAAAACCGCT TCATGCATGT TCAGGAGCTG GCGCGGCTCG GCGCCAAGAT ATCGCTCTCC 
GGCCAGACGG CGAAGGTCGA GGGTGTATCG CGGCTGAAGG GCGCACCGGT CATGGCAACG 
GACCTCAGGG CTTCCGTCTC GCTCGTCATT GCGGGCCTCG CGGCCGAGGG CGAAACCATG 
GTTTCGCGGG TTTACCACCT CGACCGCGGC TTCGAGCGCC TGGAAGAGAA GCTCACGCGT 
TGCGGCGCCC ATGTCGAGCG CGTCAGCGAC TGA

Protein sequence

MDRIRIVGGN ELHGVIPISG AKNAALPLMI ASLLTDDTLT LENVPHLADV EQLIRILGNH 
GADISVNGRR ERQGESYART VHFTSRNIVS TTAPYELVSK MRASFWVIGP LLAREGRARV 
SLPGGCAIGT RPVDLFIEGL TALGASIEID GGYVNATAPA GGLIGGRYTF PKVSVGATHV 
LMMAATLANG TTVLGNAARE PEVVDLAKCL NAMGAKISGQ GTSTITIEGV RSLSGARHRV 
LPDRIETGTY AMAVAMAGGD VILEDTEASL LDTALEAIRR AGAEISDTNN GIRIVRNGAG 
IRPVDIVTDP FPGFPTDLQA QFMGLMTRSS GVSHITETIF ENRFMHVQEL ARLGAKISLS 
GQTAKVEGVS RLKGAPVMAT DLRASVSLVI AGLAAEGETM VSRVYHLDRG FERLEEKLTR 
CGAHVERVSD