Gene Mpe_A1623 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1623
Symbol
ID	4787247
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	1751455
End bp	1752855
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	67%
IMG OID	640090191
Product	integrase or site-specific recombinase
Protein accession	YP_001020820
Protein GI	124266816
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.262588
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGTCG TGCGACGCCT GGACGAAGCT GCGCAAGCCA TCCCCTTGCG GGCGCGATCA 
CTCACGGATC TCCAGCTCAA GGCCCTGAAG CCGCGGGACA AGGCCTACAA GGTCAGCGAC 
CGGGACGGGC TGTACGCCTA CGTGGCGCCG TCGGGGACCG TCAGCCTGCG GTACGACTAC 
CGCATCGGCA GGCGCCGCGA GACCCTGACC CTCGGTCGCT ACGACGCCAC CGCTCCGGCG 
CGGGTGCCTC GGTCCCTGGA CGTGCTCGAG TACGGCATGG GCCTGTCCCT GGCCGAGGCG 
CGACTGCTGC TGACCAAGGC GAAGCGCGCG CTCGAGCAAG GCGTGTCGCC TTCGCGCGCG 
AAGGCCGAGC AGAAGGCGGC GGAATCCGAC GCCCTCACGT TCGGCAAGTG GGCCGAGCGC 
TACTTCGAGT TCAAGGGTGA TCCCAAGAGC AAGGGCGAGC AGCTGGCCGA CAGTACGCTC 
GCCATGCGTC GCTCAACCTA CAAGCGCGCG CTGGAGAAGC CCCTGGGCAA ACTGATGCTG 
GAGGAGATCA CACCCAACCG GCTGGCGGCC CTGTGCGACG ACATCAAGGC GCAGCGTGGC 
CCGGCGGTGG CGGTGCACGC CCGCGAGATC GTCCTGATGG TCTACCGACA CGTCCAGCGC 
AAGGGGATCG AAGTGCCGAA CCCGGCCGAA CGGGTGCAGG CGAGCGCCAT CGCCCGCTTC 
GAGCCGCGCG ATCGTGCGCT GTCTCCGAGC GAGCTGCGCC TGTTCCTCGC GGCGCTGGAC 
CAGTGCGCGA CGATGCCGAC GCTGCGGCTG GCCGTGCGCT TTGTGCTGCT GACCGGCGTT 
CGCAAGGGCG AGTTCATCGG TGCGACGTGG GACGAGATCG TCTTCGACAC CGAGACCTGG 
ACGATTCCGT CGCGCCGGAT GAAGGGTGGC AGGGCCCACG TGGTCTATCT CAGCGACCAG 
GCGATGGACA TCCTGACGAC GCTGCGGTCG TGCTTCTCGG CAAGCCGCTA CCTTCATCCC 
GGCCGGTATG ACAGCGACCT GCCGATCAGC GACGCGACCC TGAACCGGGT CATCGCGATG 
GCGATCCGTG GCATTCAGGC GACCGCTCCG GAGTTTCAGC CGTTCACCGT GCACGACCTG 
AGGCGGACCT TCAGCACCTC GCTGAACCGG GCCAAGTTCG ACGAGCGCTG GATCGAGATG 
GCGCTGGCGC ACGTGCCCCG GAACCGCATC GCCGCGACGT ACAACGTGGC CCGCTATGCG 
GCCGAGCGCC GGATCATGAT GCAGGCCTGG GCCGACATGC TCGACCTTTG GGAGAAGGGC 
GAGTCGGCCA AGGAAGTGAT CTTGAAGGCG AAGCAGGCAG CCTCCGAGGT GACCGACTTC 
GAGTTGGAAG ACGATCTTTG A

Protein sequence

MSVVRRLDEA AQAIPLRARS LTDLQLKALK PRDKAYKVSD RDGLYAYVAP SGTVSLRYDY 
RIGRRRETLT LGRYDATAPA RVPRSLDVLE YGMGLSLAEA RLLLTKAKRA LEQGVSPSRA 
KAEQKAAESD ALTFGKWAER YFEFKGDPKS KGEQLADSTL AMRRSTYKRA LEKPLGKLML 
EEITPNRLAA LCDDIKAQRG PAVAVHAREI VLMVYRHVQR KGIEVPNPAE RVQASAIARF 
EPRDRALSPS ELRLFLAALD QCATMPTLRL AVRFVLLTGV RKGEFIGATW DEIVFDTETW 
TIPSRRMKGG RAHVVYLSDQ AMDILTTLRS CFSASRYLHP GRYDSDLPIS DATLNRVIAM 
AIRGIQATAP EFQPFTVHDL RRTFSTSLNR AKFDERWIEM ALAHVPRNRI AATYNVARYA 
AERRIMMQAW ADMLDLWEKG ESAKEVILKA KQAASEVTDF ELEDDL