Gene Smed_5844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5844
Symbol
ID	5320146
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	807741
End bp	808937
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	60%
IMG OID	640777539
Product	N-acylglucosamine 2-epimerase
Protein accession	YP_001314471
Protein GI	150377876
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2942] N-acyl-D-glucosamine 2-epimerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.742486
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACCAT TCCCCGATTT CCGCTCGAAA GACTTCCTGC TCGCCCATAT GCGCGAGATC 
ATGGATTTCT ATCATCCGAT CTGCCTCAAC AGGGAACACG GCGGCTACCA TAACGAATAT 
CGTGACGACG GCTTCATCAC CGATCGGAAG ACCCAGCACC TCGTCTCAAC CACCCGCTTC 
ATCTTCAACT ATGCGACAGC CTCCGTCCTC TTCCAGAGGC CGGATTACGC AGAGGCGGCT 
GCCCATGGCG TCAGATATCT CGACGAGGTC CACCGCGATT CCGAGCACGG CGGCTATTTC 
TGGGTAATGC ACGGGCGCGA GGCAGCGGAT ACGACGAAGC ACTGCTACGG CCACGCCTTC 
GTTTTGCTCG CTTACGCGGC CGCCATGAAG GCCGGTATTC CAGGCATGGG CGCGCGGATT 
TCGGACACAT GGGGCCTTCT CGAAAACCGC TTCTGGGAGC CGGAGCGCGA GCTCTACAAG 
GACGAGATCA GCCGCGACTG GCAGAAGATC TCGCCCTATC GGGGCCAGAA CGCCAACATG 
CATATGACAG AGGCGATGCT GGCGGCCTAT GAGGCGACCG GTGAGATTCG CTATCTCGAC 
CGTGCCGAAA CGCTCGCCCG GCGTATCTGT GTGGAACTTG CCGCCACCGC TCAAGGTGTG 
GTCTGGGAGC ATTACCGCGC GGACTGGTCG ATCGACTGGG ATTACAACAA GGACGATCCG 
AAGCACCTGT TCCGACCCTA CGGCTATCTG CCAGGCCATA TGACGGAATG GACCAAGCTG 
CTGCTGATCC TCGAGCGCTA CCGACCGCAG GACTGGATCC TGCCGAAAGC CATTCTCCTC 
TACGAGACGG CCCTGGCAAA CAGCGCCGAT CTCGAATTCG GGGGCATGCA TTACACTTAC 
GGTCCGGACG GAAGGCTCTA CGATCCCGAT AAGTATCATT GGGTCCATTG CGAAACGCTG 
GCCGCCGCGG CAGCACTTGC CGGGCGCACC GGCCAGGAGC GTTACTGGCA GGATTACGAC 
AGGCTCTGGC GCTACAGCTG GCGGCACCTG ATCGACCATG AATATGGCTG CTGGTTCCGC 
ATACTCTCGC CGGAGGGCGT GAAGCAGAGC GATATCAAAA GCCCTTCGGG CAAGACCGAC 
TACCATCCAT TCGGGGCCTG CTACGAAATT CTGCGCGTGC TTGGGGAAGC GAAGTAG

Protein sequence

MRPFPDFRSK DFLLAHMREI MDFYHPICLN REHGGYHNEY RDDGFITDRK TQHLVSTTRF 
IFNYATASVL FQRPDYAEAA AHGVRYLDEV HRDSEHGGYF WVMHGREAAD TTKHCYGHAF 
VLLAYAAAMK AGIPGMGARI SDTWGLLENR FWEPERELYK DEISRDWQKI SPYRGQNANM 
HMTEAMLAAY EATGEIRYLD RAETLARRIC VELAATAQGV VWEHYRADWS IDWDYNKDDP 
KHLFRPYGYL PGHMTEWTKL LLILERYRPQ DWILPKAILL YETALANSAD LEFGGMHYTY 
GPDGRLYDPD KYHWVHCETL AAAAALAGRT GQERYWQDYD RLWRYSWRHL IDHEYGCWFR 
ILSPEGVKQS DIKSPSGKTD YHPFGACYEI LRVLGEAK