Gene Smed_4597 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4597
Symbol
ID	5318507
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1096819
End bp	1098066
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	61%
IMG OID	640776398
Product	glycosyl transferase group 1
Protein accession	YP_001313330
Protein GI	150376734
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.211799
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.982264
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCCTGA AACCGAAGAT CGCCGTCGTG CTGAAGGGTT ATCCGCGCCT TTCGGAAACG 
TTCATCGCAC AGGAATTGCT GGGCCTTGAA AGAGCAGGGC ATGAACTCGT CCTAATCGCC 
CTGCGCCGAC CGACTGATGG GAAGCGCCAC CCCGTCCATG ATGAAATTGG AGCGCCCGTC 
CATTACCTTC CGGAATATCT GCACGAGGAG CCGTGGCGCG TCCTTCGCGC CCTAACGAAG 
ACCGTGACGA AACGCTCCTT CTGGCGGATG CTCCGGCCGT TCTTCAGGGA TCTCGCGCGC 
GACAGATCGC GCAACCGTTT CCGTCGCCTC GGCCAGGCTC TGGTGCTCGT CGCCGAATGG 
CCGGACGATG CCGGCTGGTT GCATGCTCAT TTCATACATA CGCCGGCATC GGTGACAAGC 
TATGCCAGCA TGATCTCCGG CATACCCTGG ACTTGTTCCG CGCATGCCAA GGACATCTGG 
ACTTCGCAGG ATTGGGAGCT TTCCGACAAG CTCGGCCGCG CGCGCTGGAC GGTGACCTGC 
ACGCGAAGCG GCTATGAGCA CCTGCGGGAC CTGTCGAGCG ACAAGACCCG AGTGCATCTG 
AGTTATCACG GCCTCGATCT CGATCGGTTC CCGTCCTTCG AAGGTGAGCA TTCCCGGCGC 
GATGGCAGTG TTCCGGACGA CCCGGTGCGC ATCGTCAGTG TCGGACGCGC CGTCTCGAAA 
AAGGGATATG ACCTTCTCTT GAAGGCGCTG TCGCTGCTGC CTGCGGACCT CAGCTGGCGC 
TTCGATCATA TAGGTGCGGG CGAGCTCACC GGCAAGCTCC AGGCGCTTGC CGGTGAACTC 
GGCCTCGAAG ATCGCTTAGG ATGGCACGGC GCACTGGATC AAAAGGAGGT TCTGAGCCGC 
TACCGAGAGG CCGACATCTT CGCGCTCGCC TCTCGGGTCG CGGCGAATGG TGACCGAGAC 
GGCCTGCCGA ATGTTCTCGT AGAGGCATCG AGTCAGCGCC TTGCCTGTAT CTCGACCGCG 
GTCTCCGGAA TACCCGAACT TATCGATGAC GGTCATAATG GTATGCTGGT GCCGCCGGAA 
AATCCGACGG CACTTGCCGC GGCAATAGAG CGATTGATCC GCGATCCGGA TCTTCGCCGG 
CAACTTGGTG CCGCCGCGGA ACGGCGCGTG CGCGCCGATT TCGACCACCA TTCGAGCGTC 
GGTCAGTTGA TCGGGCTCTT CGAAAGCGAA TGGAGAAGAA GCCCTTGA

Protein sequence

MSLKPKIAVV LKGYPRLSET FIAQELLGLE RAGHELVLIA LRRPTDGKRH PVHDEIGAPV 
HYLPEYLHEE PWRVLRALTK TVTKRSFWRM LRPFFRDLAR DRSRNRFRRL GQALVLVAEW 
PDDAGWLHAH FIHTPASVTS YASMISGIPW TCSAHAKDIW TSQDWELSDK LGRARWTVTC 
TRSGYEHLRD LSSDKTRVHL SYHGLDLDRF PSFEGEHSRR DGSVPDDPVR IVSVGRAVSK 
KGYDLLLKAL SLLPADLSWR FDHIGAGELT GKLQALAGEL GLEDRLGWHG ALDQKEVLSR 
YREADIFALA SRVAANGDRD GLPNVLVEAS SQRLACISTA VSGIPELIDD GHNGMLVPPE 
NPTALAAAIE RLIRDPDLRR QLGAAAERRV RADFDHHSSV GQLIGLFESE WRRSP