Gene Mpe_A3006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3006
Symbol
ID	4784695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	3197631
End bp	3199169
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	74%
IMG OID	640091577
Product	Ppx/GppA phosphatase
Protein accession	YP_001022194
Protein GI	124268190
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.487592
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGACGA ACGCCCTGCC CGAGTTCCCC GAAGCCGCCC CGCTGGCCGC CATCGACATC 
GGCTCCAACA GCTTCCGCCT CGAGATCGGC CAGCTGACCC GGGGCCGCTA CAAGCGCATC 
GACTACCTGA AGGAGACCGT GCGGCTCGGC GGCGGGCTCG ACGCCGACGG CCGCCTGAAC 
GAGGAGGCGC AGCTGCGCGG CCTGGCCTGC CTGGCGCGCT TCGCGCTGCG GCTGCGCGGC 
TTCGCGCCGG CCCAGGTGCG CGCCGTGGCG ACCCAGACGC TGCGCGAGGC CCGGAACCGC 
GACGCCTTCC TGGCGCGAGC GCGCACCGTG CTCGGCCACC CGATCGAGGT CATCTCGGGC 
CGCGAGGAAG CCCGCCTCAT CTTCGCCGGC GTGGCGCGAC TGCAGCCGAG CGAGCGGCCG 
CGCATCGTGA TCGACATCGG CGGCCGCTCC ACCGAGATGA TCCTCGGCCA GGGCCGCACG 
CCGCGCCAGG CCGAGAGCTT CCAGGTCGGC AGCGTGAGCC TGTCGATGCG CTACTTCCCC 
GACGGCCGCT TCACCGCTGA CGCCTTCCGC GCCGCGCAGG TGGCGGCCGG CGCCGAGCTC 
GAGGAGGCGC TGCAGCCCTT CGCACCGGGA CAGTGGATCG AGGCGCTGGG CTCCTCGGGC 
ACGGTGGGTG CGGTGTCACA GCTGCTGGCG GCCAACGGCA TCAGCGACGG CGTCATCACC 
CCGGTGGGCC TGCGCTGGTG CATCGAGACC TGCCTTGCCG CCGGTCACCA GGACGCGCTG 
GACCTGCCAG GACTCAAGCC CGAACGCCGC GCGGTGCTGG GCGGCGGCCT GTCGATCCTC 
TACACGCTGG CACTGCAGTT CGGCATCGAC GCGCTGCAGC CTGCACGCGG CGCCCTGCGC 
CAGGGCGTGC TGTTCGACCT GGCCGAGCGC CTGGAGGCGG CGCAGGCCCC GGCCCGCCAC 
GCGCACCGGC AGGACATGCG CGACACCTCG GTGCACGAAC TGCAGCGCCG CTTCGGCAGC 
GACCTTTCCC AGGCCGCGCG CGTGCAGCGC CTGGCCGGTT CGCTGTACCG GAGCACCTCG 
ACGCCGCGCA ACGGGCACAC CGAGGCCGCG CGCGAGCTGG CCTGGGCCGC CGCGCTGCAC 
GAGATCGGCA TGTCGGTGTC GCACCACGAC CACCACCGCC ACAGCGCCTA CCTGTTGGCG 
CACGTGGACG CGCCGGGCTT CTCGCAGAGC CAGCAGCGGC GCGTGGCGGA GCTGGTGCTC 
GGCCACCGCG GCAGCCTGCG CAAGCTCGAC TCCACGCTGG ACCAGGAGGC CACGCTGTGG 
CCGGTGCTCA GCCTCCGCCT CGCGGCGCTG TTGTGCCATG CGCGCAACGA CGTGCCGGAG 
CGGGTGGTGG CGTTGCGGCG CACCGACGAC GGCGCGCTGC TCCGCATCGA CCGCGCCTGG 
GCCGACGGCC ATCCCCGCAC GATGCACTTG CTGGGCGAGG AGGTACGGGC CTGGGAACGG 
GCTGGCCGCC TGAAGTTGGC GGTCCGCACG GACGGCTGA

Protein sequence

MPTNALPEFP EAAPLAAIDI GSNSFRLEIG QLTRGRYKRI DYLKETVRLG GGLDADGRLN 
EEAQLRGLAC LARFALRLRG FAPAQVRAVA TQTLREARNR DAFLARARTV LGHPIEVISG 
REEARLIFAG VARLQPSERP RIVIDIGGRS TEMILGQGRT PRQAESFQVG SVSLSMRYFP 
DGRFTADAFR AAQVAAGAEL EEALQPFAPG QWIEALGSSG TVGAVSQLLA ANGISDGVIT 
PVGLRWCIET CLAAGHQDAL DLPGLKPERR AVLGGGLSIL YTLALQFGID ALQPARGALR 
QGVLFDLAER LEAAQAPARH AHRQDMRDTS VHELQRRFGS DLSQAARVQR LAGSLYRSTS 
TPRNGHTEAA RELAWAAALH EIGMSVSHHD HHRHSAYLLA HVDAPGFSQS QQRRVAELVL 
GHRGSLRKLD STLDQEATLW PVLSLRLAAL LCHARNDVPE RVVALRRTDD GALLRIDRAW 
ADGHPRTMHL LGEEVRAWER AGRLKLAVRT DG