Gene Mpe_A0761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0761
Symbol
ID	4784149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	791174
End bp	792559
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	67%
IMG OID	640089322
Product	hypothetical protein
Protein accession	YP_001019958
Protein GI	124265954
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.343621
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCACT TTCGACCCCT CGTCATCGCG CTCGCTGCAG CGCCTCTGCT TGCAGTGATG 
CCTGCCACGG CGCATTCGCC TCAGGCGCCT GCCGCGCCGG TGGCGGTGGA CGCCAAGGCG 
GCACCTGCCG AGGTCCTCTT CCGCAATGTT CGGGTCTTCG ACGGCAAGAC GGCCCGGTTG 
ACGGCCCCGT CCAATGTGCT GGTCAAGGGC AACAGCATCG CGGCGATCGG CGAAGCTGCT 
GCGTCCTCCA CCGCCACCGT GATCGACGGG GGAGGCCGCA CGCTGATGCC CGGCCTGATC 
GATGCGCACT GGCACTCCAT GATGGCGGCG ATCCCGCTGA AGGACGGGTT GTCGGCACAC 
CCGGGGTTCA TCAACATCGT GGCGGCGGGA GCGGCCAAAG ACACGCTGAT GCGCGGCTTC 
ACCAGCGTGC GGGATCTCGC GGGTCCCGCC TGGGGCTTGA AGCGCGCCAT CGACGAGGGC 
GTGACGCCGG GCCCGCGCAT CTGGCCTTCG GGCGCGATGA TCTCGCAGAC CAGCGGCCAT 
GCGGACTATC GCGCGTTCAG CGACCTGCCG CGCTCTCCAT CGTCGCCACC GCATTCAACC 
GAGGTGATGG GTGCGGCGCG CATCGCCGAC GGACCGGACG AGGTACGCCG CGCCGTGCGC 
GAGCAGTTGA TGATGGGCGC CAGCCAGATC AAGCTGGCGG CCGGCGGCGG GGTGTCCTCC 
AATTTCGATC CCCTGGATGT GGCGCAATAC GGCGAGGAAG AGTTCCGTGC CGCCGTGGAA 
TCGGCGGAGA ACTGGGGCAC CTACGTCGGC GTGCATGCAT ACACGCCGCG TGCGATCCAA 
GCGGCGATCA AGGCCGGTGT CCGCGTCATC GACCATGGCC AGCTGATGGA CGATGCCTCC 
GCCAAGCTCA TGGCAGAGAA GGGCGTGTGG TTGTCCATGC AGCCCTTCCT CGACGACGAG 
GACGCGAACC CTTTCCCGGA AGGTTCGGCG AACCGGGAGA AGCAGCTGGA GATGACCCGC 
GGGACCGACT CGGCCTATGC GCTGGCCAAG AAGTACCGGC TGAAGACGGC CTGGGGCACC 
GACACGCTGT TCGACGCCAA GCTGGCGGCG CGGCAGGGTG CGCAACTGGC GAAGATGGTG 
CGTTGGTACA CGCCGGGCGA GGTGCTGGTG ATGGCGACGG GCACCAACGC CGAACTGCTG 
GCGCTGTCGG GCAAGCGCGC CCCCTACAAG GGCCGCCTCG GCGTGGTGGA AGTGGGTGCG 
CTCGCCGACC TGCTGCTCGT CGATGGCGAT CCGATGGCCG ACATCAATCT CCTTGCCGAT 
CCGGAACGGC GACTGCTGGT CATCATGAAA GACGGCAAGC TGTACAAGAA CCGCCTGACC 
CACTGA

Protein sequence

MAHFRPLVIA LAAAPLLAVM PATAHSPQAP AAPVAVDAKA APAEVLFRNV RVFDGKTARL 
TAPSNVLVKG NSIAAIGEAA ASSTATVIDG GGRTLMPGLI DAHWHSMMAA IPLKDGLSAH 
PGFINIVAAG AAKDTLMRGF TSVRDLAGPA WGLKRAIDEG VTPGPRIWPS GAMISQTSGH 
ADYRAFSDLP RSPSSPPHST EVMGAARIAD GPDEVRRAVR EQLMMGASQI KLAAGGGVSS 
NFDPLDVAQY GEEEFRAAVE SAENWGTYVG VHAYTPRAIQ AAIKAGVRVI DHGQLMDDAS 
AKLMAEKGVW LSMQPFLDDE DANPFPEGSA NREKQLEMTR GTDSAYALAK KYRLKTAWGT 
DTLFDAKLAA RQGAQLAKMV RWYTPGEVLV MATGTNAELL ALSGKRAPYK GRLGVVEVGA 
LADLLLVDGD PMADINLLAD PERRLLVIMK DGKLYKNRLT H