Gene Smed_3812 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3812
Symbol
ID	5318366
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	264933
End bp	266204
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	60%
IMG OID	640775624
Product	extracellular solute-binding protein
Protein accession	YP_001312557
Protein GI	150375961
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.353807
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGTGA AGCCTTTTAT CAGGACGCTG ATTTCCTGTG CCGCTATCGT CGGTGCAATC 
GATGTTGCTG CCGCCACCGA ATTGTCGATG GCGGCCAATT CGACCGGTAA GAATCTGAGC 
TTTCTGCGCG AGCAGATCGC CAGGTTCGAG AAGGAGACGG GCCATAAGGT CAATCTGGTG 
ACGATGCCGG CGTCGAGCAG CGAGCAGTTC AGCCAATACC GGCTCTGGCT CGCGGCCGGC 
AACAAGGACG TCGACGTCTA CCAGACGGAT GTCATCTGGG CTCCACAGCT CGCCGAGCAG 
TTCGTAGACC TGACCGAGGC CACGAAGGAC GTCGTCGCCG ACCATTTCCC CTCGATCATT 
CAGTCACAGA CCGTCAACGG CAAGTTGGTG GCCTTGCCCT TCTATACCGA TGCGCCGGCG 
CTCTATTACC GCAAGGACCT GCTCGACAAA TACGGCAAGG CGCCGCCGAA GACCTGGGAT 
GAAATGGCAG CGACGGCCAA GGAAATTCAG GAAAAGGAGC GTGCTGCCGG CAATGCCGAT 
ATCTGGGGCT TCGTTTTCCA GGGCAATGCC TATGAAGGGC TCACCTGCAA CGCACTCGAG 
TGGATCAAGT CCTCGGGCGG TGGCCAGATC GTCGAGCCCG ATGGCACGAT CTCCGTCAAT 
AATGAGAAGG CGGCCGCGGC CGTGGAACGT GTCAAGGAAT GGATCGGCAC GATCGCGCCC 
AAGGGCGTGC TTGCCTATCA GGAAGAGGAA TCGCGCGGGG TCTGGCAGAC CGGCAATGCG 
GTCTTCATGC GTAACTGGCC CTATGCCTAT GCGCTCGGTA ACGGCGACGA CAGTGCCGTC 
AAGGGCAAAT TCGAAGTGGC CCCGTTGCCG GCCGCCGCCG ATGGCGAGAA GCCATCTTCC 
ACCCTCGGTG GATGGAATCT CGCGGTCTCG AAATATTCCG ACGAGCAGGA GGCGGCGATT 
GCGTTTGTCA AATTCCTCGG GTCAGCCGAG ACGCAGAAGG TGCGCGCGAT CGAGCTCTCG 
AACCTGCCGA CGATCGCTGC ACTTTACGAT GATCCGGAAA TCGCGGCCGC TCAGCCGTTC 
ATGCCGCACT GGAAGCCTAT CTTCGAGAGC GCCGTGCCGC GCCCCTCGGC AGTGGCCAAG 
GTGAAGTATA ACGAGGTTTC GTCCAAGTTC TGGAGCGCCG TGCACAACAC GCTTTCGGGC 
AACGGAACGG CCGCGGAGAA CCTGGAACTT CTCGAAGTCG AACTGACCGA ACTCAAGGGT 
GACTCCTGGT AA

Protein sequence

MDVKPFIRTL ISCAAIVGAI DVAAATELSM AANSTGKNLS FLREQIARFE KETGHKVNLV 
TMPASSSEQF SQYRLWLAAG NKDVDVYQTD VIWAPQLAEQ FVDLTEATKD VVADHFPSII 
QSQTVNGKLV ALPFYTDAPA LYYRKDLLDK YGKAPPKTWD EMAATAKEIQ EKERAAGNAD 
IWGFVFQGNA YEGLTCNALE WIKSSGGGQI VEPDGTISVN NEKAAAAVER VKEWIGTIAP 
KGVLAYQEEE SRGVWQTGNA VFMRNWPYAY ALGNGDDSAV KGKFEVAPLP AAADGEKPSS 
TLGGWNLAVS KYSDEQEAAI AFVKFLGSAE TQKVRAIELS NLPTIAALYD DPEIAAAQPF 
MPHWKPIFES AVPRPSAVAK VKYNEVSSKF WSAVHNTLSG NGTAAENLEL LEVELTELKG 
DSW