Gene Mpe_A3087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3087
Symbol
ID	4786660
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	3282565
End bp	3283656
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	71%
IMG OID	640091658
Product	putative zinc protease protein
Protein accession	YP_001022275
Protein GI	124268271
COG category	[R] General function prediction only
COG ID	[COG4324] Predicted aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.222342
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCTGC GTGCACGGTC CTGGTGGTTC ACTCTTGTCG CGGTCGGTGC TGCGCTGGCG 
CTGCTGGGCG GTTGCGGCAG CGTCGCCTAC CTCTCGCAAT CGGTGCAGGG CCACCTCGGC 
GTGATGCGCG CCGCGAAGCC GGTCGACGAC TGGCTGGCCG ACGCCGGCAC GCCGGCCGTG 
CTGCGCGAGC GCCTGCTGCT GAGCCAGCGC ATCCGCGACT TCGCTGTCCA GGAGCTGGGC 
CTGCCCGACA ACGCCAGCTA CCGCCGCTAT GCCGACCTCG GCCGGCCTGC CGTGGTGTGG 
AACGTGGTCG CGGCGCCCGA GCTGTCGCTG AGGTTGAAGA CCTGGTGCTT CCCGGTGGTC 
GGCTGCGTCG GCTACCGCGG TTACTTCGAC CGCGGCGCGG CCGACGCGCT GGCGGCCGAG 
TTGCTGTCCC AGGGCCAGGA GGTCAGCGTC TACGGTGTGC CTGCCTATTC CACGCTCGGC 
AAGCTGCCCG GTGACTTCTT TGCCGATCCG CTGCTCAATA CCTTCATCGG CTACCCCGAA 
GGCGAGCTGG CACGGCTGAT CTTCCACGAG CTGGCGCACC AGGTGGCCTA TGCAAAGGAC 
GACACCGAGT TCAACGAAAG CTTCGCGACC GCGGTCGAAC GCCTCGGTGG CGAGCGCTGG 
CTCGCGCAAC GGGCCGATGT GTCGGCACGC GAGGAGTACG AGCGCTACGA CGCACGCCGC 
CGCGACTTCC GCACGCTCGT GCTCGCCACC CGCACGCAGC TCGACGCGCT GTACCGCGGG 
CCCGGCAGCG AAGCCGACAA GCGTGCCGGC AAGGCCACGT TGATGGCGCA GATGCGCGCC 
GAACACGCGC GCCTCAAGGC AGGTCCGTGG GCTGGCTACG GCGGCTACGA CGCCTGGTTC 
GCGCGGGCCA ACAACGCCAG CCTGGGGGTG CAGTCGGCCT ACAACGCGCT GGTGCCGGGC 
TTCGAGGCAC TGTTCGCCGC CGAGGGTCGC GACTTCGCGC GTTTCTACGC CGAGGTGCGG 
CGCCTCGCCA GCTTGCCGCA GGCCGAACGC CGCGCCACAC TCGGAGCCGG CCGTCAGCTG 
CCGCCGCCCT GA

Protein sequence

MLLRARSWWF TLVAVGAALA LLGGCGSVAY LSQSVQGHLG VMRAAKPVDD WLADAGTPAV 
LRERLLLSQR IRDFAVQELG LPDNASYRRY ADLGRPAVVW NVVAAPELSL RLKTWCFPVV 
GCVGYRGYFD RGAADALAAE LLSQGQEVSV YGVPAYSTLG KLPGDFFADP LLNTFIGYPE 
GELARLIFHE LAHQVAYAKD DTEFNESFAT AVERLGGERW LAQRADVSAR EEYERYDARR 
RDFRTLVLAT RTQLDALYRG PGSEADKRAG KATLMAQMRA EHARLKAGPW AGYGGYDAWF 
ARANNASLGV QSAYNALVPG FEALFAAEGR DFARFYAEVR RLASLPQAER RATLGAGRQL 
PPP