Gene Smed_4136 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4136
Symbol
ID	5319278
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	605247
End bp	606521
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	62%
IMG OID	640775941
Product	extracellular solute-binding protein
Protein accession	YP_001312874
Protein GI	150376278
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.518326
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACATTC AGGCGCGTGC CTATCTGCCG CGTATCGCTG CTCTCGCTCT CGCAGGCGCG 
AGCTTTCTGG GCGTGTCTGC GGCGCAGGCC AAGGAAATCA CCATCTGGTG CTGGGACCCG 
AACTTCAACG TCGCGATCAT GAAGGAGGCG GGCGACCGCT ACACGAAGAC GCATCCAGAC 
GTCACCTTCA ACATCGTCGA CTTCGCCAAG CTCGACGTCG AGCAGAAGCT GCAGACCGGC 
CTTTCCTCCG GCACCGCCGA CGCGCTTCCC GACATCGTTC TCATCGAGGA TTACGGCGCG 
CAGAAATACC TGCAATCCTT TCCGGGCGCC TTTGCGCCGC TCTCCGGCAC CGTCGATTAC 
TCCGGTTTCG CCCCCTACAA GGTCGAGCTG ATGACCCTCG ATGGTGAAGT CTACGGAATG 
CCCTTCGATT CCGGCGTCAC CGGGCTCTAT TACCGCAAGG ATTATCTCGA AGCCGCAGGC 
TTCAAGCCGG AGGACATGCA GGATCTCACC TGGGATCGTT TCATCGAGAT CGGCAAGCAG 
GTCGAGGCAA AGACCGGCAA GAAGATGATG GGCCTCGATC CCAACGACGC CGGCCTCGTC 
CGCATCATCA TGCAGTCGGC CGGGCAATGG TATTTCGACA AGGAAGGCAA GCCGAACATC 
ACCGGCAACG CGGCGCTGAA GGCAGCCCTC GAAACCATCG GCAAGATCAT GCAGGCCAAT 
ATCTACAAGC CTGCCAACGG CTGGTCCGAC TGGGTCGGTA CCTTCACCTC CGGCGATGTC 
GCGACCGTCG TCACCGGCGT CTGGATCACC GGCACCGTCA AGGCGCAACC GGACCAGTCC 
GGCAACTGGG GCGTCGCCCC CATACCGGCG CTCTCTATCG AAGGCGCCAC GCATGCCTCC 
AATCTCGGCG GCTCCAGCTG GTACGTGCTC GAAAGCTCCG AGGAGAAGGC AGAAGCGATC 
GATTTCCTGA ACGAGATCTA TGCCAAGGAC ATCGATTTCT ATCAGAAGAT ACTCCAGGAT 
CGCGGCGCGG TCGGCTCGCT GCTCGCTGCC CGCGGCGGCG CGGCCTACGA GGCCGCAGAC 
CCCTTCTTCG GCGGCGAGAA GGTCTGGCAG AACTTCTCCG AATGGCTGGC GAAGGTTCCC 
TCGGTCAATT ACGGCATCTT CACCAATGAG GCGGATCTCG CCGTTACCGC GCAGCTCCCA 
GCCGTCACCC AGGGAACGCC CGTCGACGAA GTGCTGAAGG CGATCGAGGC CGAGATCGCC 
GGCCAGATCC AGTAA

Protein sequence

MDIQARAYLP RIAALALAGA SFLGVSAAQA KEITIWCWDP NFNVAIMKEA GDRYTKTHPD 
VTFNIVDFAK LDVEQKLQTG LSSGTADALP DIVLIEDYGA QKYLQSFPGA FAPLSGTVDY 
SGFAPYKVEL MTLDGEVYGM PFDSGVTGLY YRKDYLEAAG FKPEDMQDLT WDRFIEIGKQ 
VEAKTGKKMM GLDPNDAGLV RIIMQSAGQW YFDKEGKPNI TGNAALKAAL ETIGKIMQAN 
IYKPANGWSD WVGTFTSGDV ATVVTGVWIT GTVKAQPDQS GNWGVAPIPA LSIEGATHAS 
NLGGSSWYVL ESSEEKAEAI DFLNEIYAKD IDFYQKILQD RGAVGSLLAA RGGAAYEAAD 
PFFGGEKVWQ NFSEWLAKVP SVNYGIFTNE ADLAVTAQLP AVTQGTPVDE VLKAIEAEIA 
GQIQ