Gene Smed_0852 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0852
Symbol
ID	5321690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	910744
End bp	911913
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	63%
IMG OID	640789789
Product	glycosyl transferase group 1
Protein accession	YP_001326542
Protein GI	150396075
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.248563
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAAC GCCCCTTGCG TATAATTCAT TGCTTCAGGT CGCCGGTCGG CGGCATCTTC 
CGGCACGTGC GCGACCTTGC CGAAGCGCAC GCGAAAGCCG GGCATCAGGT CGGTATTCTT 
TGTGACAGCA CCACGGGCGG TGCCCACGAG GATGCATTGT TCGAAGAGGT TCGTCCACAT 
CTGGACCTCG GCATCGTCCG CGTGCCGATC CATCGCTCGG TCGGAGCCTC GGACGCGGCT 
GCGCTGTGGC GCAGCTACAA GGAAATCAGA AGCTTGCAAC CGGATGTGCT GCACGGGCAC 
GGCGCCAAGG GCGGCGTGTT GGCGCGCATC GCCGGTTCAG CCCTGCGGGT CAACAAGTAT 
CGCGTAGCCC GCCTCTATTC GCCCCATGGG GGAAGCCTGC ATTATGATCG GCGGTCCCTG 
GCAGGTTCGT TCATTCTTCG CATCGAGCGC CTGCAGGAAC GCCTGACCGA CGCACTCGTC 
TTCGTTTGCG AGTATGAGCG CGGCACCTAC TGCGCCAAGG TGGGCCAACC AATTGCACGC 
AGCGAACTGA TCTATAACGG CATCGAAGAT GCGGAGTTCG AGCGAGTCGA AGCCGACCCT 
GGCGCCGCAG ATTTCCTCTA TATCGGGATG ATGCGCGACC TGAAGGGCCC GGACTTCTTC 
ATCGAAGGGT TTGCCGCAGC CGAAGAGATC GCCGGCCGAA GGCTTTCCGC CCTGATGGTC 
GGAGATGGTC CCCAACAGCG GCAATACGAA GAGATGACGC TGCGAATGGG TCTAGGAGAT 
CGGGTTCGGC TGCTACCGGC GATGAGGGCG CGCAAAGCTT TCGCTCTTGC CCATGTCGTC 
GTCATTCCCT CGCGTGCCGA ATCCATGCCC TATATCGTTC TGGAAGCGCT CGCCGCAGGC 
AAGCCGGTCA TCGCAACCCG CGTAGGCGGC ATCCCGGAGG TTCTCGGGGC CGCTAGCGAG 
GCGCTCGTGC GTCCCGACGA TGCAGAAGCA CTTGCCCGGC TCATGGCCGA GGCAATTGCC 
GACGATGGCT GGGCTGCCCG GACAATGCCC GACGCCGAAG GCTTCAAGTC CCGCTTCGCG 
GCGTCCGTGA TGACCAGACA CGTCATGCAG CTGTATCGGG AGCTTACGGC AGAATCGCTC 
GTGCCGCATG GGCGGCTGCG TACAACGTAA

Protein sequence

MSERPLRIIH CFRSPVGGIF RHVRDLAEAH AKAGHQVGIL CDSTTGGAHE DALFEEVRPH 
LDLGIVRVPI HRSVGASDAA ALWRSYKEIR SLQPDVLHGH GAKGGVLARI AGSALRVNKY 
RVARLYSPHG GSLHYDRRSL AGSFILRIER LQERLTDALV FVCEYERGTY CAKVGQPIAR 
SELIYNGIED AEFERVEADP GAADFLYIGM MRDLKGPDFF IEGFAAAEEI AGRRLSALMV 
GDGPQQRQYE EMTLRMGLGD RVRLLPAMRA RKAFALAHVV VIPSRAESMP YIVLEALAAG 
KPVIATRVGG IPEVLGAASE ALVRPDDAEA LARLMAEAIA DDGWAARTMP DAEGFKSRFA 
ASVMTRHVMQ LYRELTAESL VPHGRLRTT