Gene Mpe_A0163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0163
Symbol
ID	4784126
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	171600
End bp	173663
Gene Length	2064 bp
Protein Length	687 aa
Translation table	11
GC content	72%
IMG OID	640088711
Product	endothelin-converting protein 1
Protein accession	YP_001019360
Protein GI	124265356
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG3590] Predicted metalloendopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.847092
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGCCCGC ACGACCCGCC CTTCCGTCCT GTTCACGCCT GCGGGCTGCA TCGTGCGCTG 
TTCGGCCCCG AGTCGGCGGC GGGCCAGGCC GAACCGGGCC GTGGCGCTGC GGCGTCGGGC 
ATCGAGCAGA GCTGCTTCGA CCGCTCGGTG CGCGCGCAGG ACGACCTGTT CCGCCATGTC 
AACGGCGGGT GGCTGAAGCA CACCGCCATT CCCGCCGACC GCGCGTCCAC CGGCGCCTTC 
ATGCAGATCC ACGACCGCAT CCAGGACCAG TTGCTGGCCC TGATCGACGA GGCGTCCGCC 
GAGGGCCAGG ACGGCGAGGC GCGGCAGATC GGCGATCTGT ACGCCAGCTT CATGGACGAG 
GCCGCGATCG AGGCGCGTGG CCTCGCGCCG CTGCAGGACG AACTGGCGGC TGTTGCCGCG 
ATCAACGATC GCGCGCAGTT CGGTGCATGG CTTGCCGACG CCGTCAGCGC CGGCCTGGGG 
GTGCCGCTGG CCCTGCATAT CGGCCAGGAC GATCGCGATT CGACGCGCTA CGTGCCCTTC 
CTGTCGCAAG GCGGCCTGGG CCTGCCCGAC CGCGACTACT ACCTGCTGGA GGACAACGCG 
CGTTTCGGCG AGGTGCGCGC GCAGTACCGG GCGCACATGG CCGCGATGCT GGTGCTGGCC 
GGCGAGCCTG CGGCCGCGGC CGAGGCGGCG GCGCAGGCCG TGTTGGCGCT CGAGACCGAG 
CTGGCCCAGG CGCAGTGGTC GCGCGTCGAG AACCGTGACC CGGTGAAGAC CTACAACCGC 
TGCGACTTCG CCACGCTGCG CGCGCTGGCC CCGGCGATCG ACTGGGACGG CTTCGCCGCG 
CGCACCGGCC TGGCCGGTCG CGCCGAAGGG CTGGTGGTCG GCCAGCCGAG TTACCTGGCT 
GCGCTGTCGG CGCGGCTCGC CGACGCGCCG CTCGACGCCT GGAAGGCCTA CGCGACGCTG 
CGTGTGCTGT ATGCCTACGC GCCCTTCCTG GGCCGCGCGA TCGTCGACGC CCGTTTCGCC 
TTCACCGGCA CCGTGCTGCG CGGCACGCCG GAGAACCTGC CGCGCTGGAA ACGCGGTGTC 
GCGCTGGTCG AGGGCTGCCT TGGCGAGGGC CTGGGCCAGC TCTACGTGGC CCGACACTTC 
CCGCCGGCCC ACAAGGCGCG CATGGAGGCG CTGGTCGCGC AACTGCTCGC GGCCTACCGA 
CGGAACCTCG ACACGCTGGA CTGGATGGGG CCGGCCACGC GCGCCCAGGC GCAGGCCAAG 
CTGGCCCGGC TCGTGACCAA GATCGGCTAC CCGGTGCGCT GGCGCGACTA CCGCGCGCTG 
GAGATCCGCC GCGACGACGT GGTCGGCAAC GTGCGGCGCG TGCGTGCGTT CGAGCATGCG 
CGCCAGCTCG CTCGGCTGGG CCAGCCGATC GACCGCGACG AGTGGGGCAT GACGCCGCAG 
ACCGTGAACG CCTACTACAA CCCGTCGATG AACGAGATCG TGTTCCCGGC GTCCATCCTG 
CAGCCGCCGT TCTTCGACGC GGACGCCGAC GACGCGGTGA ACTACGGCGC GATCGGTGCC 
GTCATCGGCC ACGAGATCAG CCACGGCTTC GACGACATGG GCAGCCAATA CGACGCCGAC 
GGCAATCTGC GCGACTGGTG GACTGCCGAG GACCGCGCCC GCTTCGCCGC CAAGACCAGC 
GTGCTGGTGG CGCAGTACGG TGCCTACGAG CCGCTGCCGG GCTATCCGAT CGACGGCGCG 
CTGTCGCTGG GCGAGAACAT TGCCGACAAC GCCGGCCTGG CGATCGCCTT CCAGGCCTAC 
CAGCGCTCGC TCGGTGGCCG GCCGGCCCCG GTGATCGACG GGCTGGAGGG CGCGCAGCGC 
TTCTTCTACG GCTTCGCTCA GGTGTGGCGC GGCAAGCAGC GCGAGGCGGC GCTGATCGAG 
CAGATCAAGG CCGGCCCGCA TGCGCCCGGC GAGTTCCGCG CCAACGGCAC GGTGCGCAAC 
CATCCCGGCT TCTACGCCAC CTTCGGCGTG CAGCCGGGCG ATGCGCTCTA CCTGCCCGAG 
GCGCAGCGCG TCTCCGTCTG GTGA

Protein sequence

MSPHDPPFRP VHACGLHRAL FGPESAAGQA EPGRGAAASG IEQSCFDRSV RAQDDLFRHV 
NGGWLKHTAI PADRASTGAF MQIHDRIQDQ LLALIDEASA EGQDGEARQI GDLYASFMDE 
AAIEARGLAP LQDELAAVAA INDRAQFGAW LADAVSAGLG VPLALHIGQD DRDSTRYVPF 
LSQGGLGLPD RDYYLLEDNA RFGEVRAQYR AHMAAMLVLA GEPAAAAEAA AQAVLALETE 
LAQAQWSRVE NRDPVKTYNR CDFATLRALA PAIDWDGFAA RTGLAGRAEG LVVGQPSYLA 
ALSARLADAP LDAWKAYATL RVLYAYAPFL GRAIVDARFA FTGTVLRGTP ENLPRWKRGV 
ALVEGCLGEG LGQLYVARHF PPAHKARMEA LVAQLLAAYR RNLDTLDWMG PATRAQAQAK 
LARLVTKIGY PVRWRDYRAL EIRRDDVVGN VRRVRAFEHA RQLARLGQPI DRDEWGMTPQ 
TVNAYYNPSM NEIVFPASIL QPPFFDADAD DAVNYGAIGA VIGHEISHGF DDMGSQYDAD 
GNLRDWWTAE DRARFAAKTS VLVAQYGAYE PLPGYPIDGA LSLGENIADN AGLAIAFQAY 
QRSLGGRPAP VIDGLEGAQR FFYGFAQVWR GKQREAALIE QIKAGPHAPG EFRANGTVRN 
HPGFYATFGV QPGDALYLPE AQRVSVW