Gene Smed_0186 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0186
Symbol
ID	5321016
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	205222
End bp	206415
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	62%
IMG OID	640789119
Product	extracellular solute-binding protein
Protein accession	YP_001325880
Protein GI	150395413
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATCT GGAAAATAGG CACCGCTCTC GCGGCATCGC TTCTGGCAAG CACCGCATCG 
GCGGAAACCG TTCGTTTCTG GTATCACTTC GACAATCCGG AAAACCCGAT GGCCGATCTG 
ATCGCGAAAT TCGAAGCGGC CAATCCGGGT ATCGAGATCG AAGCGGAAAA CGTTCCGTGG 
AACAGCTACT ACGATAATCT CTACACCGCG CTCGTCGGCG GCAACGCGCC GGACGCCGCG 
ATGGTCAAGC TCTTCGCCCA GCCGCGCCTC ATCGAAATGG GCGCGCTGGA GCCGCTCGGC 
GAGCGCATTG ACGGCTGGGC CGGCAAGGCG GACCTGCTCG ACAACCTCCT CGACCTCAAC 
AAGGGGTCGG ACGGTCAGCA GTACTACCTG CCGATCCAGT ATGTCGTGCT TTATCTTTAC 
TACCGCGCCG ACCTGTTCGA CGCCGCCGGC CTGAAGCCGC CGGCGACCTG CGACGCGTTC 
CGCGACGCGG CGATCAAGCT CACCAAGCAG CCGGCGACCT ACGGCTTCGG CCTGCGCGGC 
GGCAAGGGTG GCTGGGACCA GTGGGGGGCC TTCGTGCTGT CGCAGGGCGC GAAGCTTGAG 
CCGGGCGGTC TGACGACGCC GCAGGCGATC GCTGCCAACC AGTGGCTGAT CGATCTGTTC 
CAGAAGGACA AGGTCATTCC GCCCTCGGCA CCGAATGACG GCTTCCAGGA AATCACCGCC 
GCCTTCAAGA AAGGGACCAC GGCCATGACC ATTCATCATG TCGGCTCGTC GAACGACATG 
GTCAAGGCAC TCGGTGACAA GGTCTCGGCG GTGCCGTTGC CGGAATGCGG CGGCGGCCGC 
TGGACGTCCT ATGGCGACGA GTCGTTGGCT ATCTTCTCCT CCTCGGAGGT GAAGGATTCC 
GCGTGGAAGT GGATCTCGTT TCTTGCCGAG GGCGAGAACA ACGTCGCCTT CAACAAGGCG 
ACCGGGCAAA TGACGGTGAC CAAGAGCGGT TCGGAAAATT GGACGCTGCA TGAGCGCCGC 
TTTGTCGATG CGACGGTACA ATCGCTGCCC TTCGCCCATG TGCTGCCGCA GAACACCGCG 
ACGTCCGAGT TCGTCAACAC GGCCTGGCAA ACGGCCATGC AACAGGCGCT GACGGGCCAG 
ATCACCTCCG AAGAGATGAT GAAGCAGCTC GAAGCTCTTT TCGTGCAGCA ATGA

Protein sequence

MKIWKIGTAL AASLLASTAS AETVRFWYHF DNPENPMADL IAKFEAANPG IEIEAENVPW 
NSYYDNLYTA LVGGNAPDAA MVKLFAQPRL IEMGALEPLG ERIDGWAGKA DLLDNLLDLN 
KGSDGQQYYL PIQYVVLYLY YRADLFDAAG LKPPATCDAF RDAAIKLTKQ PATYGFGLRG 
GKGGWDQWGA FVLSQGAKLE PGGLTTPQAI AANQWLIDLF QKDKVIPPSA PNDGFQEITA 
AFKKGTTAMT IHHVGSSNDM VKALGDKVSA VPLPECGGGR WTSYGDESLA IFSSSEVKDS 
AWKWISFLAE GENNVAFNKA TGQMTVTKSG SENWTLHERR FVDATVQSLP FAHVLPQNTA 
TSEFVNTAWQ TAMQQALTGQ ITSEEMMKQL EALFVQQ