Gene Smed_2456 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2456
Symbol
ID	5323317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2538036
End bp	2539391
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	61%
IMG OID	640791394
Product	extracellular solute-binding protein
Protein accession	YP_001328123
Protein GI	150397656
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.674954
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCAA TGCTGAAAAA GGGCTTGCTC GCCGCGGCGC TGATGGCCTC GACCGCGCCT 
GCGGCCATGG CGCAGGAATG CGCGGATGCG GATCGCGTGC CGATCACCTG GTCGACGATT 
GCCGGCTTCT ACACCGATGC GATGGCAGAG CTGGTATCGG GCTTCGAGGC AGGCCATTGC 
GTGAAGGTCA ATGTCGTCAA CATAGACAAC TCACAGCTCT ACAACAAGCA GGTCATCGAG 
ATGGTCGGCC AGACCGGTGC CTATGATGTC GTGACCCTCG AAACCTCGGA GAAGGCGGAA 
TTCGCAGAGA ACGGTTTCAT CCTGCCGATG ACCGAATATT TCGCGGACAA GAAGGCGCAG 
CTCGACGACG TCGCGCCGAC GCTCGCTGCT CTGACGACGC AGTACAAGGA TGATGTCTGG 
GGTCTGCCTT ATTACACCTA TACGGCCGGA TATATCTATC GTGCCGACCT GTTCGACGAT 
CCCACGGAAA AGGAGGCCTT CAAGAAGCGC TTCAACTACG ACCTGGCCGT GCCGACCACC 
TGGGCGCAGC ACCGCGATAT CGCCGAGTTC TTCACGCGTA AGGCCGGTGA GACGCTGAAG 
GGCGAAAAGC TCACCAAGGA CTTTTACGGC GTCGGCCTGA TGGCCGGTCC TTTCCCGGAA 
ATCCAGGACG AGATGTCCGG CGTGCTCTGG TCGCAAGGCG CGGACTGGCT CACCGACGAG 
GGCAAGGTGC CGGTCGATGC CGTCGAAAAG GCGATGAACG ACTATCTGGA ACTGGTCAAG 
TATGCGCCGC CCGCCGCGCT CACCGTTACC TATGACGGCG TCATGAACCA GATGAAGGAC 
GGGCAGATCG CCCAGACCTA TTCCTTCTTC CTCGACCAAT GGCCGAATGC AGTGCAGACC 
GAAACCAGCG TGGCCGGCGC CAAGATGGGC GTCGCCGAGG CGCCGGAGAA GAAGGCCTAT 
ATCGGCGGCT TCCTGCTGGC GGTTTCCGCA TCCTCCGCCC ACCCGAAGGA GGCGATGGAC 
TTCGTCGCCC ACATCGGCGG ACATGATGCG CAGATGGAGT TCGCCAAGGC CGGCGGTACC 
TCGACGCTGA TGAGCGTTCT TTCCGATCCG GCCTTTGCCG CGCCGGAAAG CCGCGGGAAG 
ACCGGCCACT TTTCAACGCT CCTGGAGATC TTCGACTCGA TGAAGGGTTT CCGCTCGAAC 
CTGTTCGATA CGCCGTTCGG CGCGAAGATC TACAACACGA TGCAGATCCC GCTGCAATCG 
GCCGCTGCCG GTCAGATTTC GGCGCGCCAG GCCGCCGAAC GGCTTGCCGT CGAAGTCGAG 
AAGATTTGCG GCGGCCCGTG CCCGATCGGC AAGTGA

Protein sequence

MKSMLKKGLL AAALMASTAP AAMAQECADA DRVPITWSTI AGFYTDAMAE LVSGFEAGHC 
VKVNVVNIDN SQLYNKQVIE MVGQTGAYDV VTLETSEKAE FAENGFILPM TEYFADKKAQ 
LDDVAPTLAA LTTQYKDDVW GLPYYTYTAG YIYRADLFDD PTEKEAFKKR FNYDLAVPTT 
WAQHRDIAEF FTRKAGETLK GEKLTKDFYG VGLMAGPFPE IQDEMSGVLW SQGADWLTDE 
GKVPVDAVEK AMNDYLELVK YAPPAALTVT YDGVMNQMKD GQIAQTYSFF LDQWPNAVQT 
ETSVAGAKMG VAEAPEKKAY IGGFLLAVSA SSAHPKEAMD FVAHIGGHDA QMEFAKAGGT 
STLMSVLSDP AFAAPESRGK TGHFSTLLEI FDSMKGFRSN LFDTPFGAKI YNTMQIPLQS 
AAAGQISARQ AAERLAVEVE KICGGPCPIG K