Gene EcHS_A2637 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2637
Symbol	ppx
ID	5592304
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	2647050
End bp	2648591
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	51%
IMG OID	640921754
Product	exopolyphosphatase
Protein accession	YP_001459281
Protein GI	157161963
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	0.448662
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAATAC ACGATAAATC CCCTCGTCCG CAGGAGTTTG CTGCGGTCGA TCTTGGTTCA 
AACAGTTTTC ACATGGTCAT AGCCCGTGTG GTAGATGGTG CCATGCAGAT TATTGGCCGC 
CTGAAACAGC GGGTGCATCT GGTGGACGGC CTGGGGCCAG ATAATATGTT GAGTGAAGAG 
GCAATGACGC GCGGTTTGAA CTGTCTGTCG CTGTTTGCCG AACGGCTACA AGGGTTTTCT 
CCTGCCAGCG TCTGTATAGT CGGCACCCAT ACGCTGCGTC AGGCGCTGAA CGCCACTGAC 
TTTCTGAAAC GCGCGGAAAA GGTCATTCCC TACCCGATTG AAATTATTTC CGGTAATGAA 
GAAGCCCGTC TGATTTTTAT GGGCGTGGAA CATACCCAAC CGGAGAAAGG TCGCAAACTG 
GTTATTGATA TTGGCGGCGG ATCTACGGAA CTGGTGATTG GTAAAAATTT CGAACCGATT 
CTCGTTGAAA GCCGCCGGAT GGGTTGTGTC AGCTTTGCCC AGCTTTACTT CCCTGGCGGG 
GTCATCAATA AAGAGAATTT TCAGCGCGCT CGTATGGCGG CAGCACAAAA ACTGGAAACT 
TTAACCTGGC AATTCCGTAT TCAGGGCTGG AACGTGGCAA TGGGCGCTTC CGGTACCATA 
AAAGCCGCCC ATGAAGTGTT AATGGAAATG GGCGAGAAAG ACGGGATAAT TACCCCGGAA 
CGTCTGGAAA AACTGGTAAA AGAAGTTTTA CGTCACCGTA ATTTCGCATC GCTGAGTTTA 
CCGGGTCTTT CCGAAGAGCG GAAAACAGTC TTCGTTCCTG GACTGGCGAT TTTATGCGGT 
GTGTTTGATG CTTTAGCCAT CCGTGAACTG CGCCTTTCTG ACGGGGCGTT ACGCGAAGGC 
GTACTGTATG AAATGGAAGG ACGTTTCCGT CATCAGGATG TGCGTAGTCG CACCGCCAGC 
AGCCTCGCCA ACCAGTATCA CATCGACAGC GAGCAGGCCC GACGGGTGCT GGATACCACT 
ATGCAAATGT ACGAACAGTG GCGGGAACAG CAACCGAAGC TGGCGCATCC GCAACTGGAG 
GCGCTACTGC GATGGGCCGC CATGCTGCAT GAGGTCGGGT TGAATATCAA CCACAGCGGT 
TTGCATCGCC ACTCCGCTTA TATTCTGCAA AACAGTGACT TGCCGGGTTT TAATCAGGAA 
CAGCAGCTGA TGATGGCGAC ACTGGTGCGC TATCACCGTA AAGCGATTAA GCTCGACGAT 
CTGCCGCGCT TTACCTTGTT TAAGAAGAAA CAGTTCCTGC CACTGATACA GCTATTGCGC 
CTTGGCGTAT TACTAAACAA TCAACGTCAG GCAACCACCA CACCGCCAAC ATTGACACTG 
ATTACTGATG ACAGTCACTG GACACTGCGT TTCCCGCATG ACTGGTTTAG TCAGAATGCG 
CTGGTACTGC TTGATCTGGA AAAGGAGCAA GAATACTGGG AAGGCGTGGC TGGCTGGCGG 
TTGAAAATTG AAGAAGAAAG TACACCTGAA ATCGCCGCTT AA

Protein sequence

MPIHDKSPRP QEFAAVDLGS NSFHMVIARV VDGAMQIIGR LKQRVHLVDG LGPDNMLSEE 
AMTRGLNCLS LFAERLQGFS PASVCIVGTH TLRQALNATD FLKRAEKVIP YPIEIISGNE 
EARLIFMGVE HTQPEKGRKL VIDIGGGSTE LVIGKNFEPI LVESRRMGCV SFAQLYFPGG 
VINKENFQRA RMAAAQKLET LTWQFRIQGW NVAMGASGTI KAAHEVLMEM GEKDGIITPE 
RLEKLVKEVL RHRNFASLSL PGLSEERKTV FVPGLAILCG VFDALAIREL RLSDGALREG 
VLYEMEGRFR HQDVRSRTAS SLANQYHIDS EQARRVLDTT MQMYEQWREQ QPKLAHPQLE 
ALLRWAAMLH EVGLNINHSG LHRHSAYILQ NSDLPGFNQE QQLMMATLVR YHRKAIKLDD 
LPRFTLFKKK QFLPLIQLLR LGVLLNNQRQ ATTTPPTLTL ITDDSHWTLR FPHDWFSQNA 
LVLLDLEKEQ EYWEGVAGWR LKIEEESTPE IAA