Gene Mpe_A1084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1084
Symbol
ID	4783687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	1157063
End bp	1158505
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	66%
IMG OID	640089646
Product	C-terminal processing peptidase
Protein accession	YP_001020280
Protein GI	124266276
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.207844
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.316164
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGCTA AGACAAAAGT GGCTGGCTGG ATCGTCGTCG GGGCGGTCGC GGGTGCCTTG 
ACCACGATGC AACTGACCGC GACGGCGCGC AACCCGTCTG CGGCCTTGCC GCTGGAGGAG 
CTGCAGCAGC TCGCCGCGGT ATTCGGCATG GTGAAGAGCG ACTACGTCGA ACCGGTCGAT 
GAGAAGAAGC TGATCACCGA CGCCATCGGC GGCATGGTCG CCGGCCTCGA CCCGCACTCC 
CAGTACTTCG ACAAGAAGAC CTTCAAGGAA TTCCGCGAAG GCACCAGCGG GCGCTTCGTC 
GGTGTCGGCA TCGAGATCGG CATGGAGGAC GGGCTGGTCA AGGTGGTCTC GCCGATCGAG 
GGCTCGCCGG CCTTCCGGGC CGGCGTGAAG AGCGGCGACC TGATCACCAA GATCGACGAC 
AGCTTCGTCA AGGGCCTGAC GATGGACCAG GCCGTCAAGA AGATGCGTGG CGAGCCCAAC 
ACCAAGGTCG TGCTGACGGT GTTCCGCAAG GCCGAGAGCC GCAGCTTCCC GGTCACCATC 
ACCCGCGAGG AGATCCGCGT GCAGAGCGTG CGCGCGAAGA TGATCGAGCC CGGCTATGCC 
TGGCTGCGCG TGAGCCAGTT CCAGGACCGC ACCGTCGAGG ATTTCGCCAC CAAGCTGGCC 
GACCTGTACA AGCAGGACCC CAACCTGAAG GGCCTGGTGC TCGACCTGCG CAACGACCCG 
GGCGGTCTGC TCGAGGCGTC GGTGGCGATC TCGGCCGCCT TCCTGCCCAA GGACGTGACA 
GTGGTCTCCA CGAACGGGCA GATCGCCGAA TCGAAGGCCG TGTTCAAGGC CAATCCGGAG 
TTCTACTCGC GCCGTGGCAG CGACCCGCTG AAGAAGCTGC CCGAGGGGTT GAAGAGCGTG 
CCGCTGATCG TGCTGGTGAA CGAAGGCTCG GCCTCCGCCA GCGAGATCGT CGCCGGCGCC 
CTGCAGGATC ACAAGCGCGC CACGGTGATG GGCAGCCAGA CCTTCGGCAA GGGCTCGGTT 
CAGACGGTGC GCCAGCTTTC GCCCGACACG GCGCTGAAGA TCACCACCGC CCGCTATTAC 
ACGCCGAGCG GACGCTCGAT CCAGGCCACC GGCATCGTGC CCGACGTGTG GCTCGACGAA 
ACTGCCGAAG GCAACGTGTT CGCCGCCATC CGCACCCGCG AGGCTGACCT GGAGAAGCAC 
ATCTCCAGTG GCCAGGGCCC GGAGGTCAAG GACCCGGCGC GCGAGAAGGC CCGAGAGGAA 
GCGCTGAAGA AGCTGGAAGA GGCGAACGGC AAGGACAAGG ACAAGGCGCC CAAGCCGCTG 
CCCGAGTTCG GCAGCGCCGA GGACTTCCCG TTGCAGCAGG CGCTGAATCG CCTGAAGGGC 
AAGACGGTGC TGGCCTCGAA GACGCAGACC GAGCGCAAGC CCGAGGACAC CAAGACCAAC 
TGA

Protein sequence

MGAKTKVAGW IVVGAVAGAL TTMQLTATAR NPSAALPLEE LQQLAAVFGM VKSDYVEPVD 
EKKLITDAIG GMVAGLDPHS QYFDKKTFKE FREGTSGRFV GVGIEIGMED GLVKVVSPIE 
GSPAFRAGVK SGDLITKIDD SFVKGLTMDQ AVKKMRGEPN TKVVLTVFRK AESRSFPVTI 
TREEIRVQSV RAKMIEPGYA WLRVSQFQDR TVEDFATKLA DLYKQDPNLK GLVLDLRNDP 
GGLLEASVAI SAAFLPKDVT VVSTNGQIAE SKAVFKANPE FYSRRGSDPL KKLPEGLKSV 
PLIVLVNEGS ASASEIVAGA LQDHKRATVM GSQTFGKGSV QTVRQLSPDT ALKITTARYY 
TPSGRSIQAT GIVPDVWLDE TAEGNVFAAI RTREADLEKH ISSGQGPEVK DPAREKAREE 
ALKKLEEANG KDKDKAPKPL PEFGSAEDFP LQQALNRLKG KTVLASKTQT ERKPEDTKTN