Gene Smed_4708 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4708
Symbol
ID	5318858
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	1225798
End bp	1227054
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	63%
IMG OID	640776506
Product	glycosyl transferase group 1
Protein accession	YP_001313438
Protein GI	150376842
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.514087
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTCC TCGTCGCGGC TCACAACCAT CCGGCCCTTC ACCCGGGAGG CACGGAAATT 
TTCGCCCACG ACCTGTTCCG CGCCTATAAG CGCGCGGGCT GCGAATCGCT CTTCCTGGGC 
GCCACCAACC AGATCCACCG ACAGGCACGC CCGGGCACCA GCTTTCAAGG GATCGGCCCG 
GCAGGAGACG AACTGCTGCT GTGGTCTGGC CACTTCGACC GATTTTTCAT GAGCCAGATC 
GATCTCTACG GCGTCGTTCC CGACCTGGCG GAACTGCTGC GCGACTTCCG GCCGGACGTC 
GTCCACATTC ACCACCTGCT GCTGCTCGGC GCGGAGTTTC CACATATCGT GCGCCGTACG 
CTGCCTGAGT GCCGGATCGT CATGACGCTG CATGACTATT ATCCCATCTG TCATCACGAC 
GGCTTGATGG TGAGGACGAG CGGCAAAGAG CTTTGCCACG GAGCGAGCCC CGACAGATGC 
CATGCCTGCT TCAAGGACAT AGCACTCGAC CGGTTCGCGC TGCGCGAACG CCACCTGAAG 
GCGCTGTTGA GCGACGTCGA CCGGTTCGTG TCGCCGAGCA ATTTCCTTAA AACGCGCTTC 
GTCGAATGGG GGTTATCGGA AGACGCAATC AGCGTCATTC CGAACGGATT GCCGCCGCGC 
AAGGAACCGG CGGCAGTTCG TCGGATCGGC TCGGATCGTC CGATCTTCGG CTACTTCGGC 
AATCTCAATC CGTGGAAGGG CGTCGCTGTA CTGCTCGAAG CGGCGCGGCA GCTCATCGCA 
GAGGGGCTGG AGTTCGAGCT GCGCGTTCAT GGCGGCGCCC CCTTCCAAAG CGAGAGCTTC 
GTCGAAGAGA TCACGCGCCT GTTCCAGGAG ACGGCACCAA CCGTACAGCA GCGGGGGCCC 
TATCGGCGCG AGGACGTGAT CGACCTCGTC GCCTCGGTGG ATTGCACGAT CGTGCCCTCG 
ATCTGGTGGG AGAATGCGCC ATTGGTCATC CAGGAGGCGC AGGCTCTCGG GCGGCCGGTC 
ATAGCCAGCA ACATCGGCGG CATGGCCGAG TTGATCGAGG ATGGGTCAAA CGGGCTCACC 
GTCGCGCCCA ACGATCCGCG GGCGCTGGCC TCTGCCATGC GCCGTCTTGC ACAGGACGGC 
GGATTGGCGC GCCGGCTTGC CGCAAACGCG CACGAACCCG AGAACATCGA CACGACCGCC 
CGACGCTATC TCGAATTGAT CGACACGATT GCGCCGTCAC GAATCGAAGC GGCATAA

Protein sequence

MRVLVAAHNH PALHPGGTEI FAHDLFRAYK RAGCESLFLG ATNQIHRQAR PGTSFQGIGP 
AGDELLLWSG HFDRFFMSQI DLYGVVPDLA ELLRDFRPDV VHIHHLLLLG AEFPHIVRRT 
LPECRIVMTL HDYYPICHHD GLMVRTSGKE LCHGASPDRC HACFKDIALD RFALRERHLK 
ALLSDVDRFV SPSNFLKTRF VEWGLSEDAI SVIPNGLPPR KEPAAVRRIG SDRPIFGYFG 
NLNPWKGVAV LLEAARQLIA EGLEFELRVH GGAPFQSESF VEEITRLFQE TAPTVQQRGP 
YRREDVIDLV ASVDCTIVPS IWWENAPLVI QEAQALGRPV IASNIGGMAE LIEDGSNGLT 
VAPNDPRALA SAMRRLAQDG GLARRLAANA HEPENIDTTA RRYLELIDTI APSRIEAA