Gene ECH74115_3655 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3655
Symbol	cysP
ID	6970512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3370060
End bp	3371076
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	53%
IMG OID	643387449
Product	thiosulfate transporter subunit
Protein accession	YP_002271902
Protein GI	209398969
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4150] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGTTA ACTTACTGAA AAAGAACTCA CTCGCGCTGG TCGCTTCTCT GCTGCTGGCG 
GGCCATGTAC AGGCAACGGA ACTGCTGAAC AGTTCTTATG ACGTCTCCCG CGAGCTGTTT 
GCCGCCCTGA ACCCGCCGTT TGAACAGCAA TGGGCCAAAG ATAACGGCGG CGACAAACTG 
ACGATAAAAC AATCTCATGC CGGGTCATCA AAACAGGCGC TGGCAATTTT GCAGGGCTTA 
AAAGCCGACG TTGTCACTTA TAACCAGGTG ACCGACGTAC AAATTCTGCA CGATAAAGGC 
AAGCTTATCC CGGCGGACTG GCAGTCGCGC CTGCCGAATA ACAGCTCGCC GTTCTACTCC 
ACCATGGGCT TCCTGGTCCG TAAGGGCAAC CCGAAGAATA TCCACGACTG GAACGACCTG 
GTGCGCTCCG ACGTGAAGCT GATTTTCCCG AACCCGAAAA CGTCGGGTAA CGCGCGTTAT 
ACCTATCTGG CGGCATGGGG CGCAGCGGAT AAAGCTGACG GTGGCGACAA AGCCAAAACC 
GAACAGTTTA TGACTCAGTT CCTGAAAAAC GTTGAAGTGT TCGATACCGG CGGTCGTGGC 
GCGACCACCA CCTTTGCCGA GCGCGGCCTG GGCGATGTAC TGATTAGCTT TGAATCGGAA 
GTGAACAACA TCCGCAAACA GTACGAAGCG CAGGGCTTTG AAGTGGTGAT TCCGAAAACC 
AACATTCTGG CAGAATTCCC GGTGGCGTGG GTCGATAAAA ACGTGCAAGC CAACGGTACC 
GAAAAAGCAG CAAAAGCCTA TCTGAACTGG CTTTACAGCC CGCAGGCGCA AACCATCATC 
ACCGACTATT ACTACCGCGT GAATAACCCG GAAGTCATGG ACAAACTGAA AGATAAATTC 
CCGCAGACCG AACTGTTCCG CGTGGAAGAC AAATTTGGCT CCTGGCCGGA AGTGATGAAA 
ACCCACTTTA CCAGCGGCGG CGAGTTAGAC AAGCTGTTAG CGGCGGGGCG TAATTAA

Protein sequence

MAVNLLKKNS LALVASLLLA GHVQATELLN SSYDVSRELF AALNPPFEQQ WAKDNGGDKL 
TIKQSHAGSS KQALAILQGL KADVVTYNQV TDVQILHDKG KLIPADWQSR LPNNSSPFYS 
TMGFLVRKGN PKNIHDWNDL VRSDVKLIFP NPKTSGNARY TYLAAWGAAD KADGGDKAKT 
EQFMTQFLKN VEVFDTGGRG ATTTFAERGL GDVLISFESE VNNIRKQYEA QGFEVVIPKT 
NILAEFPVAW VDKNVQANGT EKAAKAYLNW LYSPQAQTII TDYYYRVNNP EVMDKLKDKF 
PQTELFRVED KFGSWPEVMK THFTSGGELD KLLAAGRN