Gene Mpe_A1087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1087
Symbol
ID	4783690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	1161610
End bp	1162818
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	67%
IMG OID	640089649
Product	prophage CP4-like integrase
Protein accession	YP_001020283
Protein GI	124266279
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0686158
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.733302
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTGA CTGACTTGAA ACTGCGGACG CTGACTCAGT CGGGAAAGCA CTTCGATGGC 
GGCGGGCTCT ACCTGGAGGT GACGGCCGCG GGCGGTCGTT ACTGGCGCAT GAAGTACCGC 
CATGGTGGGA AAGAGAAGCG TCTGGCGTTC GGCGTTTATC CAGAGGTCAC GCTGCGTGCC 
GCGCGCGATC GCCGCGACGA AGCCCGCAGG GTGCTCGACC AGGGCGGCGA TCCGGGCGAG 
CTGCGCAAGG CAGCCAAGGC GCAGGCCGCG CACGAGGCGT CCAACACGTT CGAGGCCGTG 
GCGAGGGACT GGCTCACGCA CCAGGCCGAT AGCTGGGAGG CCGTCACCCT GGCTCGCATC 
AAGGCGGCTT TCAAGGCGGA CGTGTTCCCG CAGCTCGGCG CGCGGCCCAT GGCGCAGATC 
AAGCCGCGCG AGGTGGCGAC CGTCGTCAAG GCGATCGAGG CGCGTGGAGC TGGCGACATG 
GCGGCGCGCG TGCTGCAGCG GATCCGGGCC GTCTTCCGAT TCGCCGTGGT GCATGAGCGC 
ATCGACTCCA ATCCGATGCT TGACCTGCAG CCCGGCGAGC TGCTGAAGCC GCGCCAGGTG 
CGGCACCGCG CCGCGCTGGC CGATCGTGAT CTGCCGGTGT TTCTGGAGAA GCTGGCGGCC 
TATGACGGCG ACGTATCCAC CTCGGCAGCC CTGCGACTGC TGATGCTCAC CGCCGTCCGA 
CCTGGCGAGC TGCGCGGCGC GCGGTGGGAC GAGATCGACA TGGATGCAGC CGAGTGGCGC 
ATTCCAGCCG AGCGCATGAA GATGCGCTCC CCTCACGTGG TTCCGCTGTC TCGGCAAGCG 
CTCGATGTGC TCCAGTTGAT GCAGCCGCTC AGCGGCGAGC GCGAGCTGGT GTTCCCAAGT 
CCCTACTACC CGGGCAAGCC GCTGAGCGAA AACACGCTGA ACAGTGCGCT GGCACGCATG 
GGCTACAAGG GCCTCGCCAC GGCACATGGC TTCCGGGCGC TGTTCTCGAC GGTGGCCAAT 
GAGTCGGGCC ATTCACCCGA CGTGATCGAG CGCCAGCTCG CGCACGTGGA GCGCAATGCG 
GTGCGAGCCG CCTATCACCG CTCGACCTAC CTGAAGGATC GTGCGCAGCT AATGCAGTGG 
TGGGCCGACT ACCTTGATGG TCGACGCAGC GGCAAGGTGG TCCCGCTGTC ATCTGCTCGC 
GTGGCCTGA

Protein sequence

MKLTDLKLRT LTQSGKHFDG GGLYLEVTAA GGRYWRMKYR HGGKEKRLAF GVYPEVTLRA 
ARDRRDEARR VLDQGGDPGE LRKAAKAQAA HEASNTFEAV ARDWLTHQAD SWEAVTLARI 
KAAFKADVFP QLGARPMAQI KPREVATVVK AIEARGAGDM AARVLQRIRA VFRFAVVHER 
IDSNPMLDLQ PGELLKPRQV RHRAALADRD LPVFLEKLAA YDGDVSTSAA LRLLMLTAVR 
PGELRGARWD EIDMDAAEWR IPAERMKMRS PHVVPLSRQA LDVLQLMQPL SGERELVFPS 
PYYPGKPLSE NTLNSALARM GYKGLATAHG FRALFSTVAN ESGHSPDVIE RQLAHVERNA 
VRAAYHRSTY LKDRAQLMQW WADYLDGRRS GKVVPLSSAR VA