Gene EcSMS35_2580 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2580
Symbol	cysP
ID	6146029
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2633981
End bp	2634997
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	54%
IMG OID	641617451
Product	thiosulfate transporter subunit
Protein accession	YP_001744616
Protein GI	170679837
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4150] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGTTA ACTTACTGAA AAAGAACTCA CTCGCGCTGG TCGCTTCTCT GCTGCTGGCG 
GGCCATGTAC AGGCAACGGA ACTGCTGAAC AGTTCTTATG ACGTCTCCCG CGAGCTGTTT 
GCCGCCCTGA ATCCGCCGTT TGAGCAACAA TGGGCAAAAG ATAACGGCGG CGACAAACTG 
ACGATAAAAC AATCTCATGC CGGATCATCA AAACAGGCGC TGGCGATTTT ACAGGGCTTA 
AAAGCCGACG TTGTCACTTA TAACCAGGTG ACCGACGTAC AAATCCTGCA CGATAAAGGC 
AAGCTGATCC CGGCCGACTG GCAGTCGCGC CTGCCGAATA ATAGCTCGCC GTTCTACTCC 
ACCATGGGTT TCCTGGTACG TAAGGGCAAC CCGAAGAATA TCCACGACTG GAACGATCTG 
GTGCGCTCCG ACGTGAAGCT GATTTTCCCG AACCCAAAAA CCTCCGGTAA CGCGCGTTAT 
ACCTATCTGG CGGCATGGGG CGCAGCGGAT AAAGCTGACG GTGGCGACAA AGCCAAAACC 
GAACAGTTTA TGACCCAGTT CCTGAAAAAC GTTGAAGTGT TCGATACTGG CGGTCGTGGC 
GCGACCACCA CTTTTGCCGA GCGCGGCCTG GGCGATGTGC TGATCAGCTT CGAGTCGGAA 
GTGAACAACA TCCGCAAACA GTATGAAGCG CAGGGCTTTG AAGTGGTGAT TCCGAAAACC 
AATATTCTGG CGGAATTCCC GGTGGCGTGG GTCGATAAAA ACGTGCAGGC CAACGGTACG 
GAAAAAGCAG CAAAAGCTTA CCTGAACTGG CTCTACAGCC CGCAGGCGCA AACCATCATC 
ACCGACTATT ACTACCGCGT AAATAACCCG GAGGTGATGG ACAAACTGAA AGACAAATTC 
CCGCAGACCG AACTGTTCCG CGTGGAAGAC AAATTTGGCT CCTGGCCGGA AGTGATGAAA 
ACCCACTTCA CCAGCGGCGG CGAGTTAGAC AAGCTGTTAG CGGCGGGGCG TAACTGA

Protein sequence

MAVNLLKKNS LALVASLLLA GHVQATELLN SSYDVSRELF AALNPPFEQQ WAKDNGGDKL 
TIKQSHAGSS KQALAILQGL KADVVTYNQV TDVQILHDKG KLIPADWQSR LPNNSSPFYS 
TMGFLVRKGN PKNIHDWNDL VRSDVKLIFP NPKTSGNARY TYLAAWGAAD KADGGDKAKT 
EQFMTQFLKN VEVFDTGGRG ATTTFAERGL GDVLISFESE VNNIRKQYEA QGFEVVIPKT 
NILAEFPVAW VDKNVQANGT EKAAKAYLNW LYSPQAQTII TDYYYRVNNP EVMDKLKDKF 
PQTELFRVED KFGSWPEVMK THFTSGGELD KLLAAGRN