Gene Smed_4395 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4395
Symbol
ID	5319160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	890916
End bp	892178
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	59%
IMG OID	640776199
Product	extracellular solute-binding protein
Protein accession	YP_001313132
Protein GI	150376536
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.87283
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCATC TTTTGAAAAC ACTGGCAGGT ATGACCGTCA TTGCCGTCGT ATCCGCCTTT 
CCCGCAAAGG CGGATACCGT TTCGATGTTT TGCTCGGCGA CCGACTACGA GCTTTGCGAG 
AAGGCTGTCC AGAAATGGAC GAAAGAAACC GGCCATGACG TGAAACTCAA CCGGATGCCG 
CAGAACCTCG ACGACGCCAT TCCGATCTAT CAGCAATTGT TCGCGGCCCA GTCGACCGAC 
ATGGATGTCC TCTACATCGA CGTCATCTGG CTGGGTATGT TCAAGGATCA TCTCCTCGAC 
CTGACGTCTC TCGTACCTGA GGAGGAGGTG AAGGCGCATT TCGCCTCTGC CGCGGATGCG 
GCGCGCCTCG ACGGCAAGCT CCTGTCGATG CCTTTCTACA TCGACACCGG CCTGATGTTC 
TATCGTAAGG ACCTGCTGGA GAAGTACGGC AAGCAGCCTC CGAAGACCTG GGACGAACTG 
ACGGCGACCG CCAAGGAGAT TCAGGATGCG GAACGCAAGG TCGGCAGTCC GGATATATGG 
GGCTATGCCT GGCAGGGCCG GAGCTATGAG GGCCTGACCT GCGATGCGCT GGAGTGGATC 
GCTTCGGCCG GCGGCGGCAC GATCCTTTCC GACGACGGAG AGGTGACAAT CAACAATCCC 
AAGACGGAGG CGGCTTTGAG CCGTGCGCGC GGCTGGATCG GGACGATTTC GCCTGAGGGG 
GTTCTGAACT ACGATGAGGA AAACTCGCGT GCCCTCTTCG AGAGCGGCAA TGCCGTCTTT 
CACCGGAACT GGCCTTATGT GTGGGGAACG TCGCAGGCCG AAGGCGGCAA GCTCGTCGGC 
AAGGTCGGGG TGAGCGCGCT TCCGGTGGGT GCGGAAGGCC AGAAGTCGAG CGGTGCGCTC 
GGTACCGCCT ATCTCGGCGT TTCCAAATAT TCCAAGAATC CGGAGCTTGC AGCGGAGCTG 
CTGCGCTACA TGGTAGGTGC GGAAGACCAG AAGATGCGTG CAATCGAAGG CGGCTACAAT 
CCGACCGTGG AGGCGCTCTA CGAAGACGCC GATGTGCTGG CGAAGATTCC GTTCCTCGGC 
ATGGCGAAGA CCGCGTTCGA AGAATCGGTC GCGCGTCCCT CGGCAGCCAC GGGCAAGAAC 
TATAATCGTG TTTCCCGTAC CTTCTACCGG GCGGTTCACG ACATCATCTC CGGCAAGGAC 
GATGTCGCGA AGGAACTCGC CGATCTCGAG CGACGCCTCG AACGCGACGT TAAAGCGAAA 
TGA

Protein sequence

MKHLLKTLAG MTVIAVVSAF PAKADTVSMF CSATDYELCE KAVQKWTKET GHDVKLNRMP 
QNLDDAIPIY QQLFAAQSTD MDVLYIDVIW LGMFKDHLLD LTSLVPEEEV KAHFASAADA 
ARLDGKLLSM PFYIDTGLMF YRKDLLEKYG KQPPKTWDEL TATAKEIQDA ERKVGSPDIW 
GYAWQGRSYE GLTCDALEWI ASAGGGTILS DDGEVTINNP KTEAALSRAR GWIGTISPEG 
VLNYDEENSR ALFESGNAVF HRNWPYVWGT SQAEGGKLVG KVGVSALPVG AEGQKSSGAL 
GTAYLGVSKY SKNPELAAEL LRYMVGAEDQ KMRAIEGGYN PTVEALYEDA DVLAKIPFLG 
MAKTAFEESV ARPSAATGKN YNRVSRTFYR AVHDIISGKD DVAKELADLE RRLERDVKAK