Gene Mpe_A3181 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3181
Symbol
ID	4786578
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	3381524
End bp	3382720
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	64%
IMG OID	640091753
Product	putative cytochrome C oxidase polypeptide II precursor
Protein accession	YP_001022369
Protein GI	124268365
COG category	[C] Energy production and conversion
COG ID	[COG1622] Heme/copper-type cytochrome/quinol oxidases, subunit 2 [COG2010] Cytochrome c, mono- and diheme variants
TIGRFAM ID	[TIGR02866] cytochrome c oxidase, subunit II

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.8149
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.584186
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACGA TCAACGCCCT TAGCAACGCC GCGAGCGCCC TCCGACGGCA GGCCATGGCG 
ACCGGTCTTG GACTGGCGGC CACGCTGTAC ACGACGGCGG CTCTGGCCGT CAACGACCTG 
CCGGGCGGTC CGGCCGTGAA TCAGCTCGAC CTGCACCCGC CGGTGACGCG CATTGCGGCT 
GAACAGCAAT GGCTGCACTA CTTCATGCTC GTGATCTGCA TGGTCATCTT CGTCGCCGTG 
TTCGGCGTCA TGTTCTATTC GATCTTCAAG CACCGTCGCT CCAAGGGGGC GAAGCCGGCC 
AACTTCCACG AATCGACCAC GGTCGAGATC ATCTGGACCG TCGTGCCGTT CTTCATCGTG 
ATCCTGATGG CGCTGCCCGC CACCAAGGTC GTGGTCGCGA TGAAGGACAC CACCAACGCC 
GACCTGACCA TCAAGGCCAC CGGCTACCAG TGGAAGTGGG GCTACGACTA CCTCAAGGGT 
GAGGGTGAGG GGATCGCCTT CGTCTCCACG CTCGATACCT CGCATCGCCT GATGTCGGAC 
AGCGGCAAGC CCGAACCGAC CGACGACTAC CTGCTCAAGG TCGACAACCC GCTGGTGGTG 
CCTGTCGACA AGAAGGTGCG CATCATCACC ACTGCCAACG ACGTGATCCA CGCCTTCATG 
GTGCCGGCCT TCGGCATCAA GCAGGATGCG ATCCCCGGCT TCGTGCGCGA CACCTGGTTC 
CGCGCCGAGA AGACCGGTGA CTTCTACGGC CAGTGCGCCG AACTTTGCGG CAAGGAGCAC 
GCCTACATGC CGATCCACGT GAAGGTGCTG TCGCAGGCCG ACTACGCGGT GTGGGTGGAA 
GGCGAGAAGA AGAAGCTGGC CGCCAAAGCC GACGATCCGG CCAAGGTCTG GGAACTGCCC 
GAACTCGTGG CCCGCGGCGA GAAGGTCTAT GCTGCCAACT GCGCTGCCTG CCACCAGGCG 
AGCGGCAAGG GCGCGGGCGC GATCAAGCCG ATCGACGGTG CCGCCGTGGT GCTCGATGCC 
GACAAGACCA AGCAGATCGC GATCCTGCTC AACGGCCAGA ACAATGGTGC GATGCCCGCC 
TGGAAGCACC TGTCGGACAC GGAGATCGCC GCCGTCATCA CCTACACCAA GAACCACTGG 
TCGAACGCGA CCGGTCAGAT CGTGCAGCCG GCCGACGTGC TCGCCGCTCG CAAGTAA

Protein sequence

MKTINALSNA ASALRRQAMA TGLGLAATLY TTAALAVNDL PGGPAVNQLD LHPPVTRIAA 
EQQWLHYFML VICMVIFVAV FGVMFYSIFK HRRSKGAKPA NFHESTTVEI IWTVVPFFIV 
ILMALPATKV VVAMKDTTNA DLTIKATGYQ WKWGYDYLKG EGEGIAFVST LDTSHRLMSD 
SGKPEPTDDY LLKVDNPLVV PVDKKVRIIT TANDVIHAFM VPAFGIKQDA IPGFVRDTWF 
RAEKTGDFYG QCAELCGKEH AYMPIHVKVL SQADYAVWVE GEKKKLAAKA DDPAKVWELP 
ELVARGEKVY AANCAACHQA SGKGAGAIKP IDGAAVVLDA DKTKQIAILL NGQNNGAMPA 
WKHLSDTEIA AVITYTKNHW SNATGQIVQP ADVLAARK