Gene Smed_4473 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4473
Symbol
ID	5318175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	954054
End bp	955121
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	60%
IMG OID	640776274
Product	putative sugar uptake ABC transporter periplasmic solute-binding protein precursor
Protein accession	YP_001313206
Protein GI	150376610
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4213] ABC-type xylose transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.659853
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTCT TTACTTCGCT TCTCGCAGCT GCGGCGATGA CGGTCGCCGG CTTCGCTGCG 
CCGGCAGTCG CCCAGGACAA GGGCATGGTC GGCATCTCCA TGCCGACAAA GACGTCGACG 
CGCTGGATTT CCGACGGCGA AACCATGGAG AAGCTGTTCA AGGATGCAGG CTATACGCCG 
GACCTGCAAT TCGCCGACGA CGATATTCCG AACCAGCTCG CGCAGATCGA GAACATGGTG 
ACCAAGGGCG CGAAGGTCCT CGTCATCGGC GCCATCGACG GCACGACGCT CTCCGACATT 
CTGCAGAAGG CCGCCGACGC CGGCGTCAAG GTCATCGCCT ATGATCGCCT GATCCGCGAT 
TCCGGCAATG TCGACTACTA TGCCACCTTC GACAACTTCC AGGTTGGCGT CCTGCAGGCG 
ACCTCGCTCG TCGAGGGTCT GAAGCTCGAC AGCGCGACCG AGCCGAAGAA CATCGAACTT 
TTCGGCGGCT CGCCGGACGA CAACAACGCC TTCTTCTTTT ACGACGGTGC AATGTCCGTT 
CTGCAGCCTC TGATTGACAG CGGCAAGCTT GTCGTCAAGT CCGGCCAGAT GGGCATGGAC 
CAGGTCGGTA CGCTGCGCTG GGACGGTGCT GTGGCTCAGG CCCGCATGGA AAACCTGCTG 
TCGTCGGCCT ATACCGATGC GAAGGTCGAC GGCGTTCTGT CGCCCTATGA CGGACTGTCG 
ATCGGCATCA TCTCTGCTCT CAAGGGCGTC GGTTACGGCT CCGGCGACAT GCCGATGCCG 
ATCGTCACCG GTCAGGACGC CGAGCTGCCT TCGGTCAAGT CCATCCTTGC GGGCGAACAA 
CATTCCACGG TCTTCAAGGA CACCCGTGAA CTCGCCAAGG TCACGGTCAA CATGGTCAAC 
GCGATCATGG ACGGCAAGGA GCCGGAAGTT AACGACACCA AGACGTATGA AAACGGAGTC 
AAGGTCGTTC CGTCCTATCT GCTGAAGCCC GTTTCCGTAG ACAAGTCGAA CGCCAAGGAC 
GTTCTTGTCG GCTCCGGCTA CTACACGGAA GATCAGCTCA ACAACTGA

Protein sequence

MKFFTSLLAA AAMTVAGFAA PAVAQDKGMV GISMPTKTST RWISDGETME KLFKDAGYTP 
DLQFADDDIP NQLAQIENMV TKGAKVLVIG AIDGTTLSDI LQKAADAGVK VIAYDRLIRD 
SGNVDYYATF DNFQVGVLQA TSLVEGLKLD SATEPKNIEL FGGSPDDNNA FFFYDGAMSV 
LQPLIDSGKL VVKSGQMGMD QVGTLRWDGA VAQARMENLL SSAYTDAKVD GVLSPYDGLS 
IGIISALKGV GYGSGDMPMP IVTGQDAELP SVKSILAGEQ HSTVFKDTRE LAKVTVNMVN 
AIMDGKEPEV NDTKTYENGV KVVPSYLLKP VSVDKSNAKD VLVGSGYYTE DQLNN