Gene Smed_4566 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4566
Symbol
ID	5319234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	1053994
End bp	1055109
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	63%
IMG OID	640776367
Product	glycosyl transferase group 1
Protein accession	YP_001313299
Protein GI	150376703
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.416296
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.520192
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCGCA ATGCGGCAAA CACAGGCAAT CCGATGATAA TGCATGTCAT TACCAATTTT 
ACCGCGAGTG CCGGCGCCGA AACGATGCTG GCGCGGCTGC TGCACGGATC GACGGACGAG 
CGCATCATCG TGGTTTCGCT GATCGGCGTT TCGGACCGGA ACCGCCGCCT CGCCGACAAT 
CCGAGAGTTT CCTATGTTTC GCTGGCAGCG GCATCGCTGA CAGCGCTTCC GGGCGCGATT 
CTTCGGCTTG CGACGCTGAT CCGGAAAGAG CGGCCCGATG TTATCCTCTG CTGGATGTAC 
CACGCGATGG TCGCCGGGAG CCTGGCGGCG GGGCTGGCCC GGCACGGGGC GCCGGTTTTC 
TGGAACGTTC GCCAATCGCT GGACGATCCC GCTTCCCTCA CGCGCAGTTC GCGCGTTGCG 
ATCGCGGCCG CGAAACTGCT GTCGCGCCGG CCGACGGGTA TTATCTACAA CAGCGCCCGC 
GCGCTCGATC TGCATCGCGC CTACGGCTAT ACAAATCAAA ATGCGGTCGT CATACCCAAC 
GGCTTCGAAC TCCCGGAGCT TGCGGCGCCC GAACCGCGGG CGGCCCGGCG CATCGGCATC 
GTGGGCCGCT TTCACCCGCA GAAAGATCAC GGGACGTTTT TCAAAGCCGC CGCCCAGGTG 
TTGAAGACCC ATCCGCAGGC AGTCTTTTCC GCAGCCGGCA ACGGGCTGGT CTGCGACAAC 
CCGGAGGTCA TGGAACTGAT CGCGAAAGCG GGCCTCCCGG CCCACGCCGT CGATCTGCGG 
GGGGAGGTCA GCGATATGCC TGCATTCTAT CGAAGCATCG ACCTGTTGGT GCTTTCGTCG 
CGGACCGAAG GCTTCCCGAA TGTCATCGCT GAGGCCATGA GCTACGGCAA GCCGATCGTC 
ACGACGGATG TTGGTGACGC GGCGGTCGTC GCCGGAAGGG CCGGCATCGC CGTACCGCCG 
CGCAATCCGC AGGCTCTCGC CGAGGCAATG CGCGCCTTCC TCGATCTGTC CGAAGCAGAA 
TACGCGCGCT ATGCGCGCAC CGCCCGAGAG CGCATCGAGA ATGAGTACGC GCTTGCCGCT 
GTGAGTGCGA AATATTCAAA ATTTCTAACG GCTTAA

Protein sequence

MRRNAANTGN PMIMHVITNF TASAGAETML ARLLHGSTDE RIIVVSLIGV SDRNRRLADN 
PRVSYVSLAA ASLTALPGAI LRLATLIRKE RPDVILCWMY HAMVAGSLAA GLARHGAPVF 
WNVRQSLDDP ASLTRSSRVA IAAAKLLSRR PTGIIYNSAR ALDLHRAYGY TNQNAVVIPN 
GFELPELAAP EPRAARRIGI VGRFHPQKDH GTFFKAAAQV LKTHPQAVFS AAGNGLVCDN 
PEVMELIAKA GLPAHAVDLR GEVSDMPAFY RSIDLLVLSS RTEGFPNVIA EAMSYGKPIV 
TTDVGDAAVV AGRAGIAVPP RNPQALAEAM RAFLDLSEAE YARYARTARE RIENEYALAA 
VSAKYSKFLT A