Gene EcSMS35_4092 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4092
Symbol	pstS
ID	6144392
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4185067
End bp	4186107
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	52%
IMG OID	641618916
Product	phosphate ABC transporter periplasmic substrate-binding protein PstS
Protein accession	YP_001746054
Protein GI	170680926
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0226] ABC-type phosphate transport system, periplasmic component
TIGRFAM ID	[TIGR00975] phosphate ABC transporter, phosphate-binding protein

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.559792
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTTA TGCGTACCAC CGTCGCAACT GTTGTCGCCG CGACCTTATC GATGAGTGCT 
TTCTCTGTGT TTGCAGAAGC AAGCCTGACA GGTGCAGGTG CAACCTTCCC TGCGCCGGTG 
TATGCCAAAT GGGCTGACAC TTACCAGAAA GAAACCGGTA ATAAAGTTAA CTACCAGGGT 
ATCGGTTCTT CCGGTGGCGT AAAACAGATT ATCGCTAATA CCGTTGATTT TGGTGCCTCT 
GACGCGCCGC TGTCTGATGA AAAATTGGCT CAGGAAGGCC TGTTCCAGTT CCCGACCGTG 
ATTGGCGGCG TGGTGCTGGC TGTTAACATT CCAGGGCTGA AGTCTGGCGA ACTGGTGCTG 
GATGGTAAAA CCCTCGGCGA CATCTACCTG GGCAAAATCA AAAAGTGGGA TGATGAAGCC 
ATCGCCAAAC TGAATCCGGG TCTGAAACTG CCTTCACAGA ACATTGCTGT CGTGCGCCGT 
GCAGATGGCT CCGGGACATC CTTCGTCTTC ACCAGCTACC TGGCGAAAGT GAACGAAGAG 
TGGAAAAACA ACGTTGGTAC TGGCTCTACC GTAAAATGGC CGATCGGTCT GGGCGGTAAA 
GGTAACGACG GTATCGCCGC GTTCGTTCAG CGTCTGCCGG GTGCAATTGG TTACGTTGAA 
TATGCTTACG CGAAGCAGAA CAACCTGGCG TACACCAAAC TGATCTCCGC TGATGGTAAA 
CCGGTTAGTC CGACCGAAGA AAACTTCGCT AATGCAGCAA AAGGCGCAGA CTGGAGCAAA 
ACATTCGCTC AGGATCTGAC TAACCAGAAA GGCGAAGATG CATGGCCTAT CACTTCTACC 
ACGTTCATTC TGATCCATAA AGATCAGAAG AAACCTGAGC AGGGTGTAGA AGTGCTGAAG 
TTCTTCGACT GGGCGTACAA AACCGGGGCT AAACAGGCTA ACGACCTGGA TTATGCCAGC 
CTGCCGGATA GCGTAGTGGA ACAGGTTCGC GCTGCGTGGA AGACCAATAT TAAAGACAGT 
AGCGGCAAGC CGCTGTACTA A

Protein sequence

MKVMRTTVAT VVAATLSMSA FSVFAEASLT GAGATFPAPV YAKWADTYQK ETGNKVNYQG 
IGSSGGVKQI IANTVDFGAS DAPLSDEKLA QEGLFQFPTV IGGVVLAVNI PGLKSGELVL 
DGKTLGDIYL GKIKKWDDEA IAKLNPGLKL PSQNIAVVRR ADGSGTSFVF TSYLAKVNEE 
WKNNVGTGST VKWPIGLGGK GNDGIAAFVQ RLPGAIGYVE YAYAKQNNLA YTKLISADGK 
PVSPTEENFA NAAKGADWSK TFAQDLTNQK GEDAWPITST TFILIHKDQK KPEQGVEVLK 
FFDWAYKTGA KQANDLDYAS LPDSVVEQVR AAWKTNIKDS SGKPLY