Gene Smed_4802 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4802
Symbol
ID	5318689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	1321175
End bp	1322296
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	60%
IMG OID	640776596
Product	glycosyl transferase family protein
Protein accession	YP_001313528
Protein GI	150376932
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.858117
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATATTC TCACGCGCAC GGCAGCGAAG CTCGCCAACG GGCGGATCGA GGAACCGCGC 
GCGCTAAATC GGATCGCCCG CGTCACCGTC GTTGTTCCTT GCTACAACTA CGGACGTTAT 
CTGCGGCAAT GTGTCGAAAG CGTCACGCTG AACCAACCAG GCGTCGACGT CGAAGTCATC 
ATCGTGGATG ATCGATCGAC TGACGATAGC GCCTATGTGG CGCGCTCAAT CCAGGATGCA 
GACAAGCGCG TACACTTGAT AGCGCACAAA CAAAACAAGG GTCACATTGC AACCTATAAC 
GACGGGCTGG AAGCCGCGAC CGGCGAATTC GTGCTGTTAC TTTCTGCCGA CGATCTGGTG 
ACACCGGGTG CACTGACCCG TGCTGCTGAA TTCCTTGCTG CGGAACCGTC TGTCGGGCTT 
GTTTATGGTA ACGCGATCCA CTTCCATGGC GAGTTGCCCG AGAGCCGAAT TGCCGGAGGG 
AGTTGGATCG TATGGCCCGG CGTCGATTGG CTGCGGATCC GCTGCCGGTC GGGATTCAAT 
ACCATCACCT CCCCGGAGGC GGTTATGCGC ACGGCAGTGC TGCGCGAAAT CGGCAACTAT 
CGCGCCGACC TGCCGCATGC TGGCGACTTC GAGATGTGGC TTCGCACCTC TGCAGTGTCA 
GACATCGGCT TCCTTGCCGG CGTTGATCAG GCCTATTACC GACATCACGC GACCAATATG 
AACAAACAGG ATTTCGGCTC GGGCACCGCC CTCGGTCAGC TGATCGACCT CAAACAGCGC 
TGGCAGTCCT TCGAAGCGGT ATTCAGCGGC GTTGGATCTG GGCTGGAGGA GGGACCACAA 
CTGCTGGAGC TTGCCCGCAG CACCATCGCG CGTCAGGTGC TGGAGCGCAT CAACTATGCC 
CATGCCAAAG GTTGGCGTGA TTTTCCCACA ACGGAATTCG AGGCTCTCGC GAGAGAAATC 
CACCACAGCC CTGCGTCCAC CAGAGCGGGA AAAGTGCTCG CCAAAAGGAG ACACGACGGA 
ACAGGCAGGC TTCCTGCTCA TGCTCTATGG CCGGCATGGG CGGTGCGCTG GCGCCTGGAG 
GAATGGTGCC GCCGGTGGCG TCGCGGCCAG ATCGGCGTCT AG

Protein sequence

MDILTRTAAK LANGRIEEPR ALNRIARVTV VVPCYNYGRY LRQCVESVTL NQPGVDVEVI 
IVDDRSTDDS AYVARSIQDA DKRVHLIAHK QNKGHIATYN DGLEAATGEF VLLLSADDLV 
TPGALTRAAE FLAAEPSVGL VYGNAIHFHG ELPESRIAGG SWIVWPGVDW LRIRCRSGFN 
TITSPEAVMR TAVLREIGNY RADLPHAGDF EMWLRTSAVS DIGFLAGVDQ AYYRHHATNM 
NKQDFGSGTA LGQLIDLKQR WQSFEAVFSG VGSGLEEGPQ LLELARSTIA RQVLERINYA 
HAKGWRDFPT TEFEALAREI HHSPASTRAG KVLAKRRHDG TGRLPAHALW PAWAVRWRLE 
EWCRRWRRGQ IGV