Gene Smed_2420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2420
Symbol
ID	5323281
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2498105
End bp	2499367
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	60%
IMG OID	640791358
Product	extracellular solute-binding protein
Protein accession	YP_001328087
Protein GI	150397620
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.228974
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGAAAC TGATCACAGC CGCCCTGCTT GCCACCCTGA TGGCCGGCAG CGCCCTTGCA 
GATACGAAGC TGAAGCTCGT GGAGGTCATA ACCAGCCCCG AGCGCACCGA AACGCTGAAG 
TCGATCGTCG CCAAGTTCGA AGAGGCGAAC CCCGGCACGA CCGTCGAGAT CATTTCGCTG 
CCCTGGGGCG AAGCCTTCCA GAAATTCGCC ACCATGGTAT CGGCCGGCGA AATCCCCGAT 
GTCATGGAAA TGCCCGACAC CTGGCTGTCG CTCTATGCCA ATAACGGCAT GCTCGAAAGC 
CTCGAGCCCT ATCTCGCAAA ATGGGAGCAC ACGCCAGGCC TCACCGAGCG CGCGCTCGAA 
CTCGGCCGGG ACGTCAACGA CACAGCTTAC ATGTTGCCTT ACGGCTTCTA TCTCCGGGCG 
ATGTTCTACA ACAAGAAGCT GCTCTCCGAA GCGGGTGTCG CCGAACCGCC GAAGACGATG 
GACGACTTCG TCAAGGCTTC CGAGGCGGTC TCCAAGCTGC CGGGCAAATC CGGTTACTGC 
CTGCGCGGCG GTCCGGGCGG GCTCAACGGC TGGGTGATGT TCGGCGCGAC CATGGCCGGC 
GACAACAAGT TCTTCAACGA GGACGGCACT TCCACGATGA ACAGCGAAGG CTGGATCAAA 
GGCCTCACCT GGGTCATCGA CCTCTACAAG AAGGGTCTGG CGCCGAAGGA TAGCGTCAAC 
TGGGGCTTCA ACGAGATCGT CGCGGGCTTC TACAGCGGCA CCTGCGCCTT TCTCGACCAG 
GACCCGGATG CCTTGATCGC TATTGCCCAG CGCATGAAGC CGGAGGATTT CGGCGTGACC 
ACCATGCCGA AGGGGCCGAG CGGCAAGGCC TTCACCACGA TCGGCTTCGC CGGCTGGTCG 
ATCCTTGCCG CCAGCCAGAA CAAGGATCTC TCCTGGAAGC TGATCGAAAC GCTGGAAGGC 
CCGGAAGGCA ATATCGAGTG GAATAAGCGC ACCGGCGCGC TGCCCGTTCA CAAGTCGGCC 
GAAAAGGACC CCTTTTATGC GAGCGCGCAG TTCAAGGGCT GGTTCGACGA ACTCGCCGAC 
AAGGACGTCG TGCTGACGGT CATGCCGACC TATCTCGAAG AATTCGCCTT CTTCAAAGAT 
TCGCTCGCCA TCAAGACGAC CCAGGAAGCT CTCCTCGGCG ACATCACGCC GGAAGAACTT 
GCCAACCAGT GGGCCGACTA CCTGACCAAG GCTCAGCAGA AATATCTCGC GAACAAGAAA 
TAG

Protein sequence

MRKLITAALL ATLMAGSALA DTKLKLVEVI TSPERTETLK SIVAKFEEAN PGTTVEIISL 
PWGEAFQKFA TMVSAGEIPD VMEMPDTWLS LYANNGMLES LEPYLAKWEH TPGLTERALE 
LGRDVNDTAY MLPYGFYLRA MFYNKKLLSE AGVAEPPKTM DDFVKASEAV SKLPGKSGYC 
LRGGPGGLNG WVMFGATMAG DNKFFNEDGT STMNSEGWIK GLTWVIDLYK KGLAPKDSVN 
WGFNEIVAGF YSGTCAFLDQ DPDALIAIAQ RMKPEDFGVT TMPKGPSGKA FTTIGFAGWS 
ILAASQNKDL SWKLIETLEG PEGNIEWNKR TGALPVHKSA EKDPFYASAQ FKGWFDELAD 
KDVVLTVMPT YLEEFAFFKD SLAIKTTQEA LLGDITPEEL ANQWADYLTK AQQKYLANKK