Gene ECH74115_5157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5157
Symbol	pstS
ID	6970506
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4800288
End bp	4801328
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	51%
IMG OID	643388825
Product	phosphate ABC transporter periplasmic substrate-binding protein PstS
Protein accession	YP_002273251
Protein GI	209400241
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0226] ABC-type phosphate transport system, periplasmic component
TIGRFAM ID	[TIGR00975] phosphate ABC transporter, phosphate-binding protein

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	0.587718
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTTA TGCGTACCAC CGTCGCAACT GTTGTCGCCG CGACCTTATC GATGAGTGCT 
TTCTCTGTGT TTGCAGAAGC AAGCCTGACA GGTGCAGGTG CAACCTTCCC TGCGCCGGTG 
TATGCCAAAT GGGCTGACAC TTACCAGAAA GAAACCGGTA ATAAAGTTAA TTACCAGGGT 
ATCGGTTCTT CCGGTGGCGT AAAACAGATT ATCGCCAATA CCGTTGATTT TGGTGCTTCT 
GACGCGCCGC TGTCTGACGA AAAACTGGCT CAGGAAGGTC TGTTCCAGTT CCCGACCGTG 
ATTGGCGGCG TGGTGCTGGC GGTTAACATT CCAGGTCTGA AGTCTGGTGA GCTGGTGCTG 
GATGGTAAAA CCCTCGGCGA TATCTACCTG GGCAAAATCA AGAAGTGGGA TGATGAAGCC 
ATCGCCAAAT TGAATCCGGG TCTGAAACTG CCTTCACAGA ACATTGCTGT AGTGCGCCGC 
GCAGATGGCT CCGGGACTTC CTTCGTCTTC ACCAGCTACC TGGCGAAAGT GAATGAAGAG 
TGGAAAAACA ACGTTGGTAC TGGCTCTACC GTAAAATGGC CGATCGGTCT GGGTGGTAAA 
GGTAACGACG GTATCGCTGC GTTCGTTCAG CGTCTGCCGG GTGCAATTGG TTACGTTGAA 
TATGCTTATG CGAAGCAAAA CAACCTGGCG TACACCAAAC TGATCTCCGC TGATGGTAAA 
CCTGTTTTGC CGACCGAAGA AAACTTCGCT AATGCAGCAA AAGGTGCAGA CTGGAGCAAA 
ACCTTCGCTC AGGATCTGAC CAACCAGAAA GGCGAAGATG CGTGGCCTAT TACCTCTACC 
ACGTTCATTC TGATCCACAA AGATCAGAAG AAACCAGAAC AAGGCACAGA AGTGCTGAAA 
TTCTTCGACT GGGCGTACAA AACCGGGGCT AAACAGGCGA ACGACCTGGA TTACGCCAGC 
CTGCCGGATA GCGTAGTTGA ACAGGTTCGC GCTGCGTGGA AGACCAATAT TAAAGACAGT 
AGCGGCAAGC CGCTGTACTA A

Protein sequence

MKVMRTTVAT VVAATLSMSA FSVFAEASLT GAGATFPAPV YAKWADTYQK ETGNKVNYQG 
IGSSGGVKQI IANTVDFGAS DAPLSDEKLA QEGLFQFPTV IGGVVLAVNI PGLKSGELVL 
DGKTLGDIYL GKIKKWDDEA IAKLNPGLKL PSQNIAVVRR ADGSGTSFVF TSYLAKVNEE 
WKNNVGTGST VKWPIGLGGK GNDGIAAFVQ RLPGAIGYVE YAYAKQNNLA YTKLISADGK 
PVLPTEENFA NAAKGADWSK TFAQDLTNQK GEDAWPITST TFILIHKDQK KPEQGTEVLK 
FFDWAYKTGA KQANDLDYAS LPDSVVEQVR AAWKTNIKDS SGKPLY