Gene ECH74115_4299 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4299
Symbol
ID	6966972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3978491
End bp	3979807
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	52%
IMG OID	643388028
Product	probable low-affinity inorganic phosphate transporter 2
Protein accession	YP_002272466
Protein GI	209399859
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0306] Phosphate/sulphate permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTAAATT TATTTGTTGG CCTTGATATA TACACAGGGC TTTTGTTATT ACTTGCTCTG 
GCATTTGTGT TGTTCTACGA AGCAATCAAT GGTTTTCATG ACACGGCGAA TGCGGTGGCA 
ACCGTTATTT ATACTCGTGC CATGCAGCCA CAGCTTGCCG TGGTGATGGC GGCATTTTTT 
AACTTTTTTG GCGTGTTATT GGGCGGACTT AGCGTTGCCT ATGCCATTGT CCATATGTTG 
CCAACCGATT TGTTGCTGAA TATGGGGTCA ACCCACGGCC TGGCGATGGT CTTTTCCATG 
CTGCTGGCGG CGATTATCTG GAACCTGGGA ACGTGGTTCT TTGGTTTACC GGCCTCCAGT 
TCGCATACCT TGATTGGCGC GATTATCGGC ATCGGTTTAA CCAACGCGCT GTTAACCGGC 
TCATCGGTGA TGGATGCGTT AAACCTGCGT GAAGTGACCA AAATTTTCTC CTCGCTGATT 
GTTTCCCCTA TCGTCGGCCT GGTCATTGCG GGAGGCCTGA TATTCCTGCT GCGACGCTAC 
TGGAGCGGAA CGAAAAAGCG TGACCGTATT CACCGCATTC CGGAAGATCG CAAAAAGAAA 
AAAGGCAAAC GTAAGCCGCC ATTCTGGACG CGTATTGCGC TGATTGTTTC CGCTGCGGGC 
GTGGCGTTTT CGCACGGCGC GAACGACGGA CAAAAAGGGA TCGGCCTGGT GATGCTGGTA 
CTGGTGGGGA TTGCCCCTGC TGGCTTCGTC GTCAATATGA ACGCGTCCGG CTATGAAATT 
ACCCGTACCC GCGATGCCGT TACCAACTTC GAACACTACC TGCAACAGCA TCCTGAACTG 
CCGCAGAAGT TGATTGCGAT GGAACCTCCA TTGCCTGCGG CATCTACTGA TGGCGCGCAA 
GTGACGGAGT TTCACTGTCA TCCGGGAAAT ACCTTTGATG CGATTGCGCG CGTTAAAACG 
ATGCTGCCAG GCAATATGGA AAGTTACGAG CCGTTAAGCG TGAGTCAGCG CAGCCAGCTG 
CGCCGCATTA TGCTGTGCAT CTCTGATACT TCCGCGAAGC TGGCGAAACT GCCAGGCGTC 
AGTAAAGAAG ACCAGAACCT GCTGAAAAAA CTGCGCAGCG ATATGTTAAG CACCATTGAG 
TACGCTCCGG TGTGGATCAT CATGGCAGTA GCACTGGCGC TCGGCATTGG CACCATGATT 
GGCTGGCGTC GTGTTGCGAT GACCATCGGT GAGAAGCCTT TTTTAATATC GTATTGTGTT 
CCTCCAGGCG GCGAACCTGC TTTTCCAGTT CGCGGATACG TTGCTGGTCT GGAGTAA

Protein sequence

MLNLFVGLDI YTGLLLLLAL AFVLFYEAIN GFHDTANAVA TVIYTRAMQP QLAVVMAAFF 
NFFGVLLGGL SVAYAIVHML PTDLLLNMGS THGLAMVFSM LLAAIIWNLG TWFFGLPASS 
SHTLIGAIIG IGLTNALLTG SSVMDALNLR EVTKIFSSLI VSPIVGLVIA GGLIFLLRRY 
WSGTKKRDRI HRIPEDRKKK KGKRKPPFWT RIALIVSAAG VAFSHGANDG QKGIGLVMLV 
LVGIAPAGFV VNMNASGYEI TRTRDAVTNF EHYLQQHPEL PQKLIAMEPP LPAASTDGAQ 
VTEFHCHPGN TFDAIARVKT MLPGNMESYE PLSVSQRSQL RRIMLCISDT SAKLAKLPGV 
SKEDQNLLKK LRSDMLSTIE YAPVWIIMAV ALALGIGTMI GWRRVAMTIG EKPFLISYCV 
PPGGEPAFPV RGYVAGLE