Gene EcHS_A3943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3943
Symbol	pstS
ID	5591202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3937664
End bp	3938704
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	51%
IMG OID	640923050
Product	phosphate ABC transporter periplasmic substrate-binding protein PstS
Protein accession	YP_001460527
Protein GI	157163209
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0226] ABC-type phosphate transport system, periplasmic component
TIGRFAM ID	[TIGR00975] phosphate ABC transporter, phosphate-binding protein

Plasmid Coverage information

Num covering plasmid clones	62
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTTA TGCGTACCAC CGTCGCAACT GTTGTCGCCG CGACCTTATC GATGAGCGCT 
TTCTCTGTGT TTGCAGAAGC AAGCCTGACA GGTGCAGGTG CAACCTTCCC TGCGCCGGTG 
TATGCCAAAT GGGCTGACAC TTACCAGAAA GAAACCGGTA ATAAAGTTAA CTACCAGGGT 
ATAGGTTCTT CCGGTGGCGT AAAACAGATT ATCGCTAATA CCGTTGATTT TGGTGCCTCT 
GACGCGCCGC TGTCTGATGA AAAATTGGCT CAGGAAGGCC TGTTCCAGTT CCCGACCGTG 
ATTGGCGGCG TGGTGCTGGC TGTTAACATT CCAGGGCTGA AGTCTGGCGA ACTGGTGCTG 
GATGGTAAAA CCCTCGGCGA CATCTACCTG GGCAAAATCA AGAAGTGGGA TGATGAAGCC 
ATCGCCAAAC TGAATCCGGG TCTGAAACTG CCTTCACAGA ACATTGCTGT AGTACGCCGC 
GCAGATGGCT CCGGGACTTC CTTCGTCTTC ACCAGCTACC TGGCGAAAGT GAACGAAGAG 
TGGAAAAACA ACGTTGGTAC TGGCTCTACC GTAAAATGGC CGATCGGTCT GGGCGGTAAA 
GGTAATGACG GTATCGCCGC GTTCGTTCAG CGTCTGCCGG GTGCAATTGG TTACGTTGAA 
TATGCTTACG CTAAGCAGAA CAACCTGGCG TACACCAAAC TGATCTCCGC TGATGGTAAA 
CCGGTTAGTC CGACCGAAGA AAACTTCGCT AATGCAGCAA AAGGTGCAGA CTGGAGCAAA 
ACCTTCGCTC AGGATCTGAC CAACCAGAAA GGCGAAGATG CATGGCCTAT TACCTCTACC 
ACGTTCATTC TGATCCACAA AGATCAGAAG AAACCAGAAC AAGGCACAGA AGTGCTGAAG 
TTCTTCGACT GGGCGTACAA AACCGGGGCT AAACAGGCGA ACGACCTGGA TTATGCCAGC 
CTGCCGGATA GCGTCGTTGA ACAGGTTCGC GCTGCGTGGA AGACCAATAT TAAAGACAGT 
AGCGGTAAGC CGCTGTACTA A

Protein sequence

MKVMRTTVAT VVAATLSMSA FSVFAEASLT GAGATFPAPV YAKWADTYQK ETGNKVNYQG 
IGSSGGVKQI IANTVDFGAS DAPLSDEKLA QEGLFQFPTV IGGVVLAVNI PGLKSGELVL 
DGKTLGDIYL GKIKKWDDEA IAKLNPGLKL PSQNIAVVRR ADGSGTSFVF TSYLAKVNEE 
WKNNVGTGST VKWPIGLGGK GNDGIAAFVQ RLPGAIGYVE YAYAKQNNLA YTKLISADGK 
PVSPTEENFA NAAKGADWSK TFAQDLTNQK GEDAWPITST TFILIHKDQK KPEQGTEVLK 
FFDWAYKTGA KQANDLDYAS LPDSVVEQVR AAWKTNIKDS SGKPLY