Gene Mpe_A3207 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3207
Symbol
ID	4786546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	3409191
End bp	3410540
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	67%
IMG OID	640091780
Product	putative biotin carboxylase protein
Protein accession	YP_001022395
Protein GI	124268391
COG category	[I] Lipid transport and metabolism
COG ID	[COG0439] Biotin carboxylase
TIGRFAM ID	[TIGR00514] acetyl-CoA carboxylase, biotin carboxylase subunit

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.301064
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00428909
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTTCAAGA AGATCCTGAT CGCCAACCGA GGCGAGATCG CCCTCCGCAT CCAGAGAGCC 
TGCCGCGAGC TCGGCGTGCG CGCCGTCATC GTCTACTCGG AGGCCGACCG CGACGCCAAG 
TACGTGAAGC TCGCCGACGA GGCGGTCTGC ATCGGCCCGC CGGCCTCGGC GCAGAGCTAT 
CTCAACATGC CGGCCATCAT CGCCGCCGCC GAGGTGACGG ATGCCGAGGC CATCCACCCC 
GGCTACGGCT TCCTCAGTGA GAACGCCGAC TTCGCCGAGC GCGTGCAACA GAGCGGCTTC 
ACCTTCATCG GCCCGACGCC GGAGTCGATC CGCGTGATGG GCGACAAGGT GGCTGCCAAG 
CAGGCCATGA TCAAGTCGGG CGTGCCCACG GTGCCGGGCG CCGAGGGCGC GTTGCCGGAC 
GACCCGAAGG AGATCATCCG CCAGGCGCGC GCGATCGGCT ACCCGGTCAT CATCAAGGCC 
GCCGGTGGTG GCGGCGGACG CGGCATGCGG GTGGTGCACA CCGAGGCGGC GCTGATCCAC 
GCGGTGCAGA CGACGCGCGC CGAGGCCGGC GCGGCCTTCG GCAACCCGAC CGTCTACATG 
GAGAAGTTCC TCGAGAATCC GCGCCACATC GAGATCCAGG TGCTGGCCGA CACCCACCGC 
AACGCGGTGT GGCTGGGCGA GCGCGACTGC TCGATGCAGC GTCGCCACCA GAAGATCATC 
GAGGAAGCTC CGGCGCCCGG CATCCCGCGG CGCGTGATCG AGCGCATCGG CGAACGCTGC 
GTCGCCGCCT GCAAGAAGAT CGGCTATCGG GGCGCCGGTA CCTTCGAGTT CCTGTACGAA 
AACGGCGAGT TCTACTTCAT CGAGATGAAC ACCCGCGTGC AGGTCGAGCA CCCGGTGACC 
GAGCTCGTGA CCGGCGTCGA CATCGTGCAG ATGCAGATCA AGATCGCCGC CGGCGAGAAG 
CTTCCGTTCA CGCAACGCCA GATCGAGATG CGGGGCCACG CGATCGAGTG CCGCATCAAC 
GCCGAGGACC CTTACAAGTT CACGCCGTCA CCGGGCCGCA TCACGATGTG GCATCCGCCG 
GGCGGCCCCG GCGTGCGGGT CGATTCGCAC GCATACACCA ACTACTTCGT GCCGCCGAAC 
TACGACTCGA TGATCGGCAA GATCATCACT CACGGCGACA CCCGCGAGCA GGCCTTGGCC 
CGCATGCGCA CGGCGCTGCT GGAGACGGTG ATCGAAGGGA TCCAGACCAA CACGCCGCTG 
CACCGCGAGT TGGTGGTCGA CGCGAAATTC GTCGAGGGCG GCACGAGCAT CCATTACCTC 
GAAGGCTGGA TGGCCCAGCG CAAGCGCTGA

Protein sequence

MFKKILIANR GEIALRIQRA CRELGVRAVI VYSEADRDAK YVKLADEAVC IGPPASAQSY 
LNMPAIIAAA EVTDAEAIHP GYGFLSENAD FAERVQQSGF TFIGPTPESI RVMGDKVAAK 
QAMIKSGVPT VPGAEGALPD DPKEIIRQAR AIGYPVIIKA AGGGGGRGMR VVHTEAALIH 
AVQTTRAEAG AAFGNPTVYM EKFLENPRHI EIQVLADTHR NAVWLGERDC SMQRRHQKII 
EEAPAPGIPR RVIERIGERC VAACKKIGYR GAGTFEFLYE NGEFYFIEMN TRVQVEHPVT 
ELVTGVDIVQ MQIKIAAGEK LPFTQRQIEM RGHAIECRIN AEDPYKFTPS PGRITMWHPP 
GGPGVRVDSH AYTNYFVPPN YDSMIGKIIT HGDTREQALA RMRTALLETV IEGIQTNTPL 
HRELVVDAKF VEGGTSIHYL EGWMAQRKR