Gene Smed_4859 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4859
Symbol
ID	5318844
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1360143
End bp	1361162
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	62%
IMG OID	640776644
Product	taurine ABC transporter, periplasmic binding protein
Protein accession	YP_001313576
Protein GI	150376980
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4521] ABC-type taurine transport system, periplasmic component
TIGRFAM ID	[TIGR01729] taurine ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0843259
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCACT ACAGAAAATT CAAGCTTATA TCCGGCGCCC TTGCGATAGC GACCGGGCTG 
TTAGCCGGCT TTGCGGCCCG GGCGGAAACC AGTGTCGTCG TCGGCTACCA GCAGATCGTC 
GGCCCGTTCA TTTCGGCAAT CGCGGATGGC CGCTTCGATG CCGCAGCCAA GGAGGCCGGC 
TACTCGATCG ATTGGCGCCA GTTCAGCTCG GGAGGCGACA TTTCGACGGC GCTTGCATCG 
GGTAATGTGC CGATCGGCGT TATCGGTTCG ACCGGTACGA CAGCCGCCGC GACCCGCGGC 
GTCGAGCTCG AACTTTTCTG GATCCTCGAC AATATCGGCA AATCGGAAGC GCTTGTCGCA 
CGCGAGGGAT CCGGCATCGC AAAGCCGGAA GATCTGATAG GAAAGAATGT CGGCGTTCCC 
TTCGTGTCGA CCTCTCACTT CCATCTGCTG GTCGGCCTGG GAGAGGTCTG GAAAATCGAT 
CCGCGGGAAG TGAACATCCT CAACATGAAG CCGCCGCAGA TCGTCGCCGC CTGGCAGCGC 
GGCGATATCG ACGCCGCCTA TGTCTGGCCG CCGGCCCTTT CGGAGCTCCT GAAAACGGGT 
AAGGTGATCT CGGATTCCGA GGCGGTCGGC GCGGCGAGCG TGCCCACATT CGACGGCCTC 
GTGGTCGATA AGAAATGGGC CGAGGAAAAT CCGGATTTCA TGGCGGCCTT CACCAGGGTG 
CTCGCCGAGT CCTATGCCGA TTTCAAGGCC AATGGAAGCG GCTGGACGGC GGACTCGCCG 
GAGGTGCAGG GCATGGTCAA GTTGATCGGC GGCGACGCCG AGGGTATCGT CCAGGCCCTC 
AACCTTCTAT CCTTCCCGAC CGCCGAGGAA CAGGTCTCCG ACAGGTGGCT TGGCGGCGGT 
GCCGTCCGGG CACTGGAGGC GAGCGCCAGG TTTCTGGTCG AGCAGAAGCA GATCGACAAT 
GCGCTCGACG ATTACGCGCC CTTCGTCAAC AGCGCCTACG CGAAAGAAGT CTCCAAGTAG

Protein sequence

MIHYRKFKLI SGALAIATGL LAGFAARAET SVVVGYQQIV GPFISAIADG RFDAAAKEAG 
YSIDWRQFSS GGDISTALAS GNVPIGVIGS TGTTAAATRG VELELFWILD NIGKSEALVA 
REGSGIAKPE DLIGKNVGVP FVSTSHFHLL VGLGEVWKID PREVNILNMK PPQIVAAWQR 
GDIDAAYVWP PALSELLKTG KVISDSEAVG AASVPTFDGL VVDKKWAEEN PDFMAAFTRV 
LAESYADFKA NGSGWTADSP EVQGMVKLIG GDAEGIVQAL NLLSFPTAEE QVSDRWLGGG 
AVRALEASAR FLVEQKQIDN ALDDYAPFVN SAYAKEVSK