Gene Smed_3042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3042
Symbol
ID	5323920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	3191144
End bp	3192091
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	61%
IMG OID	640791991
Product	ABC-type sugar transport system periplasmic component-like protein
Protein accession	YP_001328703
Protein GI	150398236
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGCTA ATTGGAGGAA GGCGGCGGCC GCCGCCGTCG TAGGATTTCT ATTGAATGCA 
ACCGGCGCGA ATGCGCTGAA TCTCGCCTGG GTGCACGCAA ATGCCGCCGC CCAATCCGAG 
CAGCGGGTCA AGGCCGGCTT CGATGCCTGG CTGAAGGAAA CCGGCAAGGA CTGGAATGTG 
AGCCTGCTCG ACAGCGGCGG CTCCGGCGAA CGCACCGCAT CCAACCTTCA GGACGCGGCT 
TCCCGCGGCG TCGATGCGAT CATCATCACC ATGGCGGATC TGCGCGCGTC CCGCGCCGCA 
ATCGATGCCG CGGTCGACGC AAAAATCCCG ATCATCACCG TCGACAGCGG TTACATTCCG 
GGCGTTCTGG TCGACGTCAC CACAAATAAC TGGGCCATGT CTTCGGATGT TTCGCCCTAT 
CTGCTGAACG AACTGGGTGG GAAGGGCCGC ATCATATTCC TTCGCATGGC CGAACATCAC 
GGCACCCGCA AGCGCGGCGA CGTGATGGAG ACCATCCTCA GGGAATACCC GGACGTGAAG 
GTTCTGGCCG AGCACAACAT CGACTACACC GCCTTCTTCG AGGATACGAC ATCGACGATG 
CAGGATTATG CATCCCGGTT CGGAGACGAG ATCGACGCCG TCTGGGCTCC CTGGGACGAG 
CCTGCGCAAG CGGCGATCAA CGTGCTGCAG GCTGCCGGCC TCAAGAACGT GAAGGTTATC 
GGCATCGACG GCCATCCCAA TGCCGTCACC GAGGTCTGCA AGCCGGACGG TCTGATGATC 
GCCACAGTCA GTCAGCCCTT CGAGAAGATG GGTGCACAGG CCGGCGCGTG GATCGAGGAG 
ATCGTCGTCA GGAAAGAAGA CCCAGCCAAG GTCATACCGG CGAAGACGGT CTATATGGAC 
GCCCCGTTGG TCACCAAGCA GAACTGCAAG GACTTCCTCC CGAAGTGA

Protein sequence

MSANWRKAAA AAVVGFLLNA TGANALNLAW VHANAAAQSE QRVKAGFDAW LKETGKDWNV 
SLLDSGGSGE RTASNLQDAA SRGVDAIIIT MADLRASRAA IDAAVDAKIP IITVDSGYIP 
GVLVDVTTNN WAMSSDVSPY LLNELGGKGR IIFLRMAEHH GTRKRGDVME TILREYPDVK 
VLAEHNIDYT AFFEDTTSTM QDYASRFGDE IDAVWAPWDE PAQAAINVLQ AAGLKNVKVI 
GIDGHPNAVT EVCKPDGLMI ATVSQPFEKM GAQAGAWIEE IVVRKEDPAK VIPAKTVYMD 
APLVTKQNCK DFLPK