Gene Smed_4998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4998
Symbol
ID	5318719
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1513014
End bp	1514006
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	54%
IMG OID	640776780
Product	UDP-glucose 4-epimerase
Protein accession	YP_001313712
Protein GI	150377116
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1087] UDP-glucose 4-epimerase
TIGRFAM ID	[TIGR01179] UDP-glucose-4-epimerase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.163773
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0224202
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATTT TGGTAACAGG TGGCGCCGGA TACATCGGGA GCCACATGGT TTGGTGCCTT 
CTCGACGCGC ACGAAGACGT TGTTGTCCTT GATCGTCTCT CCACTGGGTT TCGCTGGGCG 
GTAGCGCCGG AAGCCAAATT TTATGAAGGC GATATCGGCG ATTCTGAGCT TCTGAACAGG 
ATTTTTGCTA GCCATGATAT TGAAGCAATC ATCCACTTTG CCGGGTCAGT CGTGGTTCCC 
GAGTCTGTCG CCGATCCTTT GACGTACTAT GATAATAACA CGGTCAAGTC ACGGGCGCTG 
ATCGCGTCAG CAGTGAAAGC CAAAATCAAG TATTTTGTTT TTTCTTCGAC CGCAGCCGTC 
TATGGTACTC CAGACGGAAA CGGCCCGGTC AATGAAGCCG CGCCTTTACG GCCGGAATCG 
CCGTATGGTT CGTCCAAGCT GATGACCGAG ATAATGCTCA AGGACGCGGC GTTTGCTCAT 
GACATCACAT ACACGGTGCT GCGCTATTTT AACGTCGCGG GCGCAGACGT TCATGGGCGC 
ACAGGCCAAT CAACCGCAGG CGCTACGCAC CTAATCAAGG TCGCCTGCGA AGCTGCATTG 
GGGAAACGCA ACGGAATTGA CGTTTACGGC GCCGATTATC CCACTCCTGA TGGCACTTGC 
ATCCGTGACT TTATCCACGT CACCGACCTG GTAAACGCAC ATTTAAGGGC CCTGGAGCGG 
ATGCGGGCAG GAGGCAGCTC CATTGTCGCG AACTGCGGAT ATGGCCGAGG CTTTTCAGTT 
CTGGACGTCT TGCATCAGGT GAAGCAAGCA TCCGGCGTCG ACTTCCCCGT AAGAATTGTC 
GAGAGGCGCC CGGGTGATGC TGTATCCGTT GTGGCAGATC CGATGAGGAT TACCCGAGAA 
CTTGCCTGGG AGCCTTGCCA CGATGACCTT AACTTCATCG TACGAACCTC GCTGGATTGG 
GAGTCTCGTT TAAGCCGGAG AAATACATAT TAA

Protein sequence

MAILVTGGAG YIGSHMVWCL LDAHEDVVVL DRLSTGFRWA VAPEAKFYEG DIGDSELLNR 
IFASHDIEAI IHFAGSVVVP ESVADPLTYY DNNTVKSRAL IASAVKAKIK YFVFSSTAAV 
YGTPDGNGPV NEAAPLRPES PYGSSKLMTE IMLKDAAFAH DITYTVLRYF NVAGADVHGR 
TGQSTAGATH LIKVACEAAL GKRNGIDVYG ADYPTPDGTC IRDFIHVTDL VNAHLRALER 
MRAGGSSIVA NCGYGRGFSV LDVLHQVKQA SGVDFPVRIV ERRPGDAVSV VADPMRITRE 
LAWEPCHDDL NFIVRTSLDW ESRLSRRNTY