Gene EcolC_4266 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4266
Symbol
ID	6068031
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4718463
End bp	4719503
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	51%
IMG OID	641603703
Product	phosphate ABC transporter periplasmic substrate-binding protein PstS
Protein accession	YP_001727189
Protein GI	170022235
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0226] ABC-type phosphate transport system, periplasmic component
TIGRFAM ID	[TIGR00975] phosphate ABC transporter, phosphate-binding protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.291529
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTTA TGCGTACCAC CGTCGCAACT GTTGTCGCCG CGACCTTATC GATGAGCGCT 
TTCTCTGTGT TTGCAGAAGC AAGCCTGACA GGTGCAGGTG CAACCTTCCC TGCGCCGGTG 
TATGCCAAAT GGGCTGACAC TTACCAGAAA GAAACCGGTA ATAAAGTTAA CTACCAGGGT 
ATAGGTTCTT CCGGTGGCGT AAAACAGATT ATCGCTAATA CCGTTGATTT TGGTGCCTCT 
GACGCGCCGC TGTCTGATGA AAAATTGGCT CAGGAAGGCC TGTTCCAGTT CCCGACCGTG 
ATTGGCGGCG TGGTGCTGGC TGTTAACATT CCAGGGCTGA AGTCTGGCGA ACTGGTGCTG 
GATGGTAAAA CCCTCGGCGA CATCTACCTG GGCAAAATCA AGAAGTGGGA TGATGAAGCC 
ATCGCCAAAC TGAATCCGGG TCTGAAACTG CCTTCACAGA ACATTGCTGT AGTACGCCGC 
GCAGATGGCT CCGGGACTTC CTTCGTCTTC ACCAGCTACC TGGCGAAAGT GAACGAAGAG 
TGGAAAAACA ACGTTGGTAC TGGCTCTACC GTAAAATGGC CGATCGGTCT GGGCGGTAAA 
GGTAATGACG GTATCGCCGC GTTCGTTCAG CGTCTGCCGG GTGCAATTGG TTACGTTGAA 
TATGCTTACG CTAAGCAGAA CAACCTGGCG TACACCAAAC TGATCTCCGC TGATGGTAAA 
CCGGTTAGTC CGACCGAAGA AAACTTCGCT AATGCAGCAA AAGGTGCAGA CTGGAGCAAA 
ACCTTCGCTC AGGATCTGAC CAACCAGAAA GGCGAAGATG CATGGCCTAT TACCTCTACC 
ACGTTCATTC TGATCCACAA AGATCAGAAG AAACCAGAAC AAGGCACAGA AGTGCTGAAG 
TTCTTCGACT GGGCGTACAA AACCGGGGCT AAACAGGCGA ACGACCTGGA TTATGCCAGC 
CTGCCGGATA GCGTCGTTGA ACAGGTTCGC GCTGCGTGGA AGACCAATAT TAAAGACAGT 
AGCGGTAAGC CGCTGTACTA A

Protein sequence

MKVMRTTVAT VVAATLSMSA FSVFAEASLT GAGATFPAPV YAKWADTYQK ETGNKVNYQG 
IGSSGGVKQI IANTVDFGAS DAPLSDEKLA QEGLFQFPTV IGGVVLAVNI PGLKSGELVL 
DGKTLGDIYL GKIKKWDDEA IAKLNPGLKL PSQNIAVVRR ADGSGTSFVF TSYLAKVNEE 
WKNNVGTGST VKWPIGLGGK GNDGIAAFVQ RLPGAIGYVE YAYAKQNNLA YTKLISADGK 
PVSPTEENFA NAAKGADWSK TFAQDLTNQK GEDAWPITST TFILIHKDQK KPEQGTEVLK 
FFDWAYKTGA KQANDLDYAS LPDSVVEQVR AAWKTNIKDS SGKPLY