Gene EcSMS35_2650 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2650
Symbol	ppx
ID	6143834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	2709410
End bp	2710951
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	51%
IMG OID	641617521
Product	exopolyphosphatase
Protein accession	YP_001744686
Protein GI	170682766
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAATAC ACGATAAATC CCCTCGTCCG CAGGAGTTTG CTGCGGTCGA TCTTGGTTCA 
AACAGTTTTC ACATGGTCAT AGCCCGTGTG GTAGATGGTG CCATGCAGAT TATTGGCCGC 
CTGAAACAGC GGGTGCATCT GGCGGACGGC CTGGGGCCAG ATAATATGTT GAGTGAAGAA 
GCAATGACGC GCGGTTTAAA CTGTCTGTCG CTGTTTGCCG AACGGCTACA AGGGTTTTCT 
CCTGCCAGCG TCTGTATAGT TGGCACCCAT ACACTGCGTC AGGCGCTGAA CGCCACTGAC 
TTTCTGAAAC GCGCGGAAAA GGTCATTCCC TACCCGATTG AAATTATTTC CGGTAATGAA 
GAAGCCCGTC TGATTTTTAT GGGCGTGGAA CATACCCAAC CGGAGAAAGG TCGCAAACTG 
GTTATTGATA TTGGCGGCGG ATCTACGGAA CTGGTGATTG GTGAAAATTT CGAACCTATT 
CTCGTTGAAA GCCGCCGGAT GGGTTGTGTC AGCTTTGCCC AGCTTTATTT CCCTGGCGGG 
GTCATCAATA AAGAGAATTT CCAGCGCGCT CGTATGGCGG CAGCACAAAA ACTGGAAACG 
TTAACCTGGC AATTCCGTAT TCAGGGCTGG AACGTGGCAA TGGGCGCTTC CGGTACCATA 
AAAGCCGCCC ATGAAGTGTT AATGGAAATG GGCGAGAAAG ACGGGATAAT TACCCCGGAA 
CGTCTGGAAA AACTGGTAAA AGAAGTTTTA CGTCACCGTA ATTTCGCATC GCTGAGTTTA 
CCGGGTCTTT CCGAAGAGCG GAAAACAGTC TTCGTTCCTG GACTGGCGAT TTTATGCGGT 
GTGTTTGATG CTTTAGCCAT CCGTGAACTG CGCCTTTCTG ACGGGGCGTT ACGCGAAGGC 
GTACTGTATG AAATGGAAGG ACGTTTCCGT CATCAGGATG TGCGTAGTCG CACCGCCAGC 
AGCCTCGCCA ACCAGTATCA CATCGACAGC GAACAGGCCC GACGGGTGCT GGATACCACT 
ATGCAAATGT ACGAACAGTG GCGGGAACAG CAACCGAAGC TGGCGCATCC GCAACTGGAG 
GCGCTACTGC GATGGGCCGC CATGCTGCAT GAGGTCGGGT TGAATATCAA CCACAGCGGT 
TTGCATCGCC ACTCCGCTTA TATTCTGCAA AACAGCGACT TGCCGGGTTT TAATCAGGAA 
CAGCAGTTGA TGATGGCGAC GCTGGTGCGC TATCACCGTA AAGCGATTAA GCTCGACGAT 
CTGCCGCGCT TTACCTTGTT TAAGAAGAAA CAGTTTCTGC CACTGATTCA GCTATTGCGC 
CTTGGCGTAT TACTCAATAA TCAACGTCAG GCAACCACCA CACCGCCAAC ATTGACGCTG 
ATTACCGATG ACAGTCACTG GACACTGCGT TTCCCGCATG ACTGGTTTAG TCAGAATGCG 
CTGGTACTGC TTGATCTGGA AAAGGAGCAA GAATACTGGG AAGGCGTGGC TGGCTGGCGG 
TTGAAAATTG AAGAAGAAAG TACCCCAGAA ATCGCCGCTT AA

Protein sequence

MPIHDKSPRP QEFAAVDLGS NSFHMVIARV VDGAMQIIGR LKQRVHLADG LGPDNMLSEE 
AMTRGLNCLS LFAERLQGFS PASVCIVGTH TLRQALNATD FLKRAEKVIP YPIEIISGNE 
EARLIFMGVE HTQPEKGRKL VIDIGGGSTE LVIGENFEPI LVESRRMGCV SFAQLYFPGG 
VINKENFQRA RMAAAQKLET LTWQFRIQGW NVAMGASGTI KAAHEVLMEM GEKDGIITPE 
RLEKLVKEVL RHRNFASLSL PGLSEERKTV FVPGLAILCG VFDALAIREL RLSDGALREG 
VLYEMEGRFR HQDVRSRTAS SLANQYHIDS EQARRVLDTT MQMYEQWREQ QPKLAHPQLE 
ALLRWAAMLH EVGLNINHSG LHRHSAYILQ NSDLPGFNQE QQLMMATLVR YHRKAIKLDD 
LPRFTLFKKK QFLPLIQLLR LGVLLNNQRQ ATTTPPTLTL ITDDSHWTLR FPHDWFSQNA 
LVLLDLEKEQ EYWEGVAGWR LKIEEESTPE IAA