Gene Smed_1253 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1253
Symbol
ID	5322100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1343557
End bp	1344612
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	64%
IMG OID	640790194
Product	glycosyl transferase group 1
Protein accession	YP_001326938
Protein GI	150396471
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.708089
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.587919
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTGGATA TCCGCGACGT CGAGGTGATC GCGCCGAACT TCAAGCGGCG CCTTTCCGGC 
GTTACCTCGT CAATCATCCA GCTGGTGCCT GTGCAGCGTG CCCTTGGGCA GAAGATCGCG 
GTTCTCGGGC CTGGACTTCC AAAGAGCTTG CCGTCGGTTC GCTTTCGCGA TCTGATCCGC 
CTCTGGAAGA GGCCGCCGGG ACGGCGGTGC CGAGTCTGGC ATGCGCGCCG CAATGTCGAG 
ATGCTGCCGG CCGTTCTCCT CCGCGACCTG CTGCGGATGA AGATCAGGAT CGTCTTTACC 
TCCGCTTCGC AGCGCCGGCA TACCGGATGG AGCAAGTTCC TTATCGGCCG CATGGACGCG 
GTTATCGCCA CCAGTGCCAG GACGGCCGCC TATCTCGAAG TGCCGAACAC CGTTATCCTG 
CATGGAATTG ATACGCAGCG CTTTCAACCG CCTTTCGACA AGGCGGAGGC GAAGCAGGCG 
CTCGGCCTCG ATCCTGCGAA GAAATTCGTC GGATGCTTCG GGCGCGTACG CCGCCAGAAA 
GGAACAGACC TGTTCGTCGA CAGCATGATC GCCCTCCTGC CCGGCCGTCC GGGCTGGGGT 
GCAATCGTTG CCGGCCGTGC CACCGGTCCC CACGCGGCCT TCGAAACCGA ACTGAAGGAA 
CGCGTCGCAA AGGCCGGACT CGCCGACCGA ATCCTCTTTG TCGGCGAGCA TACGAATATT 
CCCGATTGGT ACCGCGCTCT CGACCTCTTC ATCGCACCGC AGCGATGGGA AGGCTTCGGC 
CTCACGCCGC TGGAAGCCAT GGCGACCGGG GTGCCGGTGG TGGCAACCGA TGTCGGCGCC 
TTTTCGGAAC TCGTAACAGT CGGGAACGAA GAAACCGGCC TCATCGTTGC AGCCGACGAT 
CTCACCGCAA TGGTCGGCGC GGCAGCCGCC TACATGGACG ACCTGCCGCG GCTTGCGGCC 
GCCGGCGCCA ATGGTCTTGC GCGGACGGCA AAGAACTTCG CCATCGAAGG GGAAGCACGC 
GCGATCGGCG CGGTTTACGA CAGTCTTACG CGCTGA

Protein sequence

MVDIRDVEVI APNFKRRLSG VTSSIIQLVP VQRALGQKIA VLGPGLPKSL PSVRFRDLIR 
LWKRPPGRRC RVWHARRNVE MLPAVLLRDL LRMKIRIVFT SASQRRHTGW SKFLIGRMDA 
VIATSARTAA YLEVPNTVIL HGIDTQRFQP PFDKAEAKQA LGLDPAKKFV GCFGRVRRQK 
GTDLFVDSMI ALLPGRPGWG AIVAGRATGP HAAFETELKE RVAKAGLADR ILFVGEHTNI 
PDWYRALDLF IAPQRWEGFG LTPLEAMATG VPVVATDVGA FSELVTVGNE ETGLIVAADD 
LTAMVGAAAA YMDDLPRLAA AGANGLARTA KNFAIEGEAR AIGAVYDSLT R