Gene Smed_4930 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4930
Symbol
ID	5318246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1439595
End bp	1440584
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	61%
IMG OID	640776713
Product	putative sugar uptake ABC transporter periplasmic solute-binding protein precursor
Protein accession	YP_001313645
Protein GI	150377049
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.947336
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGAAGG CACTATTGCT TGCCGTTGCC GCTCTGGCAC TCAGCGCCGG AACGACCATG 
GCCCAGAAGA AACAGCTCGT CATTGTGGTG AAGGGGCTCG ACAATCCCTT CTTTGAAGCC 
ATCAACCAGG GTTGCCAGAA ATGGAACAAG GAAAATCCGG ACTCCGAATA CGAATGTTTC 
TACACAGGCC CGGCTTCAAC TTCCGATGAG GCAGGCGAGG CCCAGATCGT CCAGGACATG 
CTGGGCAAAG CTGAAACCGC CGCCATCGCC ATCTCGCCGT CCAATGCGAA ACTCATCGCC 
CAGACGCTGA AAACCTCAAA CCCTACCGTC CCGGTGATGA CCGTGGATGC GGATCTCGCG 
GCCGAGGATT CGGCCCTGCG CAAAACATAT CTGGGAACCG ACAACTACCT GATGGGCTAC 
CGCATCGGCG AGTACATCAA GAAAGCCAAG CCCGATGGCG GCAAGATCTG CACCATCGAG 
GGTAACCCGG GGGCCGACAA CATTCTGCGG CGCGCCCAGG GCATGCGCGA CGCGCTGACC 
GGCCAGAAGG ACCTGGCGGA GCTCAAGGGC GAAGGCGGCT GGACCGAAGT GGCCGGTTGC 
CCCGTCTTCA CCAATGACGA CGGCGCCAAG GGCGTGCAGG CGATGACGGA CATCCTTGCC 
GCCAACCCCG ACCTGGACGC TTTCGGGATC ATGGGGGGAT GGCCGCTGTT CGGCGCGCCG 
CAGCCCTATC GCGACCTGTT CAGGCCGGTG GCCGACAAGA TCGCCAAGAA CGAATTCGTC 
ATCGGTGCCG CCGACACGAT CGGCGAGGAG GTCGCGATCG CGCGGGAAGG ATTGGTCACC 
GCTCTGGTTG GACAGCGGCC GTTCGAAATG GGCTATAAGG CACCTCAGGT GATGCTCGAC 
CTGATCGCCG GTAAACCTGT CGAAGACCCG GTCTTTACCG GCCTCGACGA GTGCACAAAA 
GAGACCGCGG ACACCTGCAT TCAGAAATAG

Protein sequence

MRKALLLAVA ALALSAGTTM AQKKQLVIVV KGLDNPFFEA INQGCQKWNK ENPDSEYECF 
YTGPASTSDE AGEAQIVQDM LGKAETAAIA ISPSNAKLIA QTLKTSNPTV PVMTVDADLA 
AEDSALRKTY LGTDNYLMGY RIGEYIKKAK PDGGKICTIE GNPGADNILR RAQGMRDALT 
GQKDLAELKG EGGWTEVAGC PVFTNDDGAK GVQAMTDILA ANPDLDAFGI MGGWPLFGAP 
QPYRDLFRPV ADKIAKNEFV IGAADTIGEE VAIAREGLVT ALVGQRPFEM GYKAPQVMLD 
LIAGKPVEDP VFTGLDECTK ETADTCIQK