Gene Mpe_B0201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_B0201
Symbol
ID	4787802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008826
Strand	-
Start bp	182162
End bp	183940
Gene Length	1779 bp
Protein Length	592 aa
Translation table	11
GC content	59%
IMG OID	640092607
Product	hypothetical protein
Protein accession	YP_001023212
Protein GI	124262742
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTCAGTG CGCGTGCCAG ACGCGCCGAG TCGACACCTG AACACACCAG CGTGGCGGAC 
TCCGTTTGGC TGGCGCTTTC CGCAGCGGCG GAGAACGCCG AGTGGCTCGC GGCTGCGTCG 
ATACCTGTCG GTCGAGTAGG ACTCACAGAC ATTGCTCGAG CTCTGGCCGC GCTCGAGGAC 
TCTATTGCCG AGACCAGCTG GCCAGAAGCT CAGAAGTTCA GTCGTTCAAA TGAGACTAGG 
CGCTGGCTGC TAGAGCACAA GCTCTTTCCG CCAAACATCG ACCCAGAACG ACTGAGCCGC 
CACTTCGTCA GCCGGTTCGA TCGCGTCGCG CCTCAGAATC GAAAGTTGTT CAGCGAACTA 
CCGGACGGCG CGAACACTGT TCATCGCTAC CCTGTGGGTG CACTGCCCCA CGAGTCATTA 
GCTGACCTCA AGGCCCAAAT ACGGCAGACG CTCGACACCG ATCTCGCCAG AGTCGTCGAG 
GGAGCAGTCA AGGATCTTGA CGCATTCGCC ACTCTGCAGT TGACGATCGC AGACCTTGCG 
CGGAGCGAGT GCCACGGAAG CGAGCTCGAG CAACTCAAGT TGTTCATTGA GTCCAACGCG 
CACCTGCGGC ATAAGTTCGT GCCTGAGATA GTGCGCGTGG CTAGCCCCCA AACGGTCTTG 
ACCGCATACG CCCAGGTCAT CGAAAAGTGG CGGCGAGAGG CACGTGTACC AATACTTCCA 
ACCGTGTATG GCGGCGAAGC GATGTGCGCC CTGGCCCGTG ACTACGGCGT GAAGATCGAT 
CGCAACAAAG CATATCGACT CCTGACCCCA ACGGTCCTGA CTCAGACGGA AATGCTTGCC 
TGCGCGCTCA TTCTTCAATG CGCGTCACGA TGGAACTTCA CGACTGTCGT AGCCCTCACC 
ACGAAGGGAA TAGTTCCTAA CGGCAATGGG TTCATCGTGA CTTCACTGAA GGGACGAACG 
AATCAAACTG CTCCCGATCT GGTCGTATCA CCTCGAGATC ACGAAGTCCT GCGGGCCTTG 
CGCACACTCA AAGAGAATCT TGGCGAAGTC AAAGCGCTCG GTTGGGTCGC GAGCGGTGAG 
GACCGCCTCT TCTTCAACAC GCACGTAGCT AGGCGCGGCG TAGTCCGTCC CTATGCCAAC 
TGGCACTACG TCCTGTCGGG ATTCATCTCT CGACATGACT TGCCTCAGTT CTCACTGGAC 
CAGGTTCGAG TTCAAGCGAT CAATGCCTTT GATCTCGAGA GCGCGAGTAT CGAGGCGACG 
CAACGGAAGG CCGGACATGC TACGTCAACC ACAACGGCGC GTTACCTGGA CCAACCCATC 
CTTCGGGCCA TTAACTCGTC AATAAATTTG GCCTACCAGC GCGAGCTAGA ACGCTCTGTG 
CAGTTCGCCA TCGAAGGTCA ACCATGCCCG ACGGGCAGGC TTTTCTCACC GGTGGGCGAT 
GGAAGTTCGT GCGCTGACCC TGCAACACCA CCGAGGCTCG ATATGCTCGT CGACGGGCTT 
TGCGAAGCAC ACGAATGCCA CCTTGGCGCC GGGTGCCCCA ACAGAAGAAT CGTCATCGAC 
ACCGATGCAC TCAGGGACCT CACGTGCACG CACCGGTTCT ACAGTCGTCA CTGGAAGGCG 
CTCCTCGATG AGAACGCCGA AGCATTCGAG AAGCACCACC TTCCTACGAT GCTGTTCACA 
TTCGGCCTTC GAGAAATTGT CGCGCAGGGA CCTTATCGAA GGTACCTGGC ACTGGCCGAA 
GGGCCTGTCG ATCCACCAGC ATTCCCGCCA CTGAGCTAG

Protein sequence

MLSARARRAE STPEHTSVAD SVWLALSAAA ENAEWLAAAS IPVGRVGLTD IARALAALED 
SIAETSWPEA QKFSRSNETR RWLLEHKLFP PNIDPERLSR HFVSRFDRVA PQNRKLFSEL 
PDGANTVHRY PVGALPHESL ADLKAQIRQT LDTDLARVVE GAVKDLDAFA TLQLTIADLA 
RSECHGSELE QLKLFIESNA HLRHKFVPEI VRVASPQTVL TAYAQVIEKW RREARVPILP 
TVYGGEAMCA LARDYGVKID RNKAYRLLTP TVLTQTEMLA CALILQCASR WNFTTVVALT 
TKGIVPNGNG FIVTSLKGRT NQTAPDLVVS PRDHEVLRAL RTLKENLGEV KALGWVASGE 
DRLFFNTHVA RRGVVRPYAN WHYVLSGFIS RHDLPQFSLD QVRVQAINAF DLESASIEAT 
QRKAGHATST TTARYLDQPI LRAINSSINL AYQRELERSV QFAIEGQPCP TGRLFSPVGD 
GSSCADPATP PRLDMLVDGL CEAHECHLGA GCPNRRIVID TDALRDLTCT HRFYSRHWKA 
LLDENAEAFE KHHLPTMLFT FGLREIVAQG PYRRYLALAE GPVDPPAFPP LS