Gene Mpe_A1351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1351
Symbol
ID	4785457
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	1455633
End bp	1457258
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	65%
IMG OID	640089917
Product	steroid monooxygenase
Protein accession	YP_001020548
Protein GI	124266544
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2072] Predicted flavoprotein involved in K+ transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.881234
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGACA AGACCGTTGC CAAGACCACC AGGGTGGACG CCGTGGTCAT CGGGGCAGGC 
ATCGCCGGCC TGTACCAGGT CTATCGCCTG CGTGAGCAGG GGTTCGACGT CCAGGCTTTC 
GAGGCCGGCT CCAACGTCGG AGGCACCTGG TACTGGAATC GCTACCCGGG CGCCCGGTTC 
GATTCCACGG CCGAGGTCTA CCAGTTCTGG TTTTCGGAAG ATCTCTACAA GGGGTGGAAA 
CCGAGCGAGC GCTTCCCGGC GCAGCCCGAG TCCGAGCGCT GGCTGAACTA CGTGGCGGAC 
CGCTGTGACC TGCGCAAGCA TTACCGGTTC AGCACGCGCG TCGAGGCGGC GCACTACGAT 
GAAGCTGCGC AGAGCTGGTC GATCACGACC GACCAGGGCG ATACCGTCCA GGCGCGCTTC 
CTCATCACCT GCTGCGGCAT GCTGTCGGCG CCGCTGACGT CGGTGTTCCC CGGTCAGGAC 
AGCTTCAAGG GCCAGTTGTT CCACACCGCG CGTTGGCCGA AGGAACCGGT CGATTTCACC 
GGCAAACGCG TGGGCATCGT GGGCACCGGG GCGACGGGCA TCCAGGTCAT CCAGACGATC 
GCGAGTCAGG TCGGCCACCT CAAGGTGTTC CTGCGCACGC CGCAGTACAC GATCCCGATG 
AACAACCCGA AGTACACCGA GGCGGTCTGG GCCGGATTCT CGAGCCGCTT CCACGAGATG 
AAGGAACGCG TGCAGCGAAC CTTTGCCGGC CACGTCTACG ACTTCGGCGG CTACGGCACT 
TGGGCCGAAA GGACGCCCGA GGAGCGGATC GCCGTGCTGG AGGAGCTCTG GAACGACGGC 
TCGCTGGCGT TGTGGCTGGC CTCGTTCTCC GAAATGTTCT TCGACGAAAA GGTCAACGCC 
GAGGTCTCCG AGTTCGTGCG CGGGAAGATG CGCGAGCGGC TCAAGGACCC GGTGCTGTGC 
GAGAAGTTGA TCCCCACGAA CTACGGCTTC GGGACCAACC GCGTGCCACT GGACACCAAC 
TACCTGGAGG CCTACCACCG CCCGAACGTC GAGATCGTTG ACGTGAAGGC GTCGCCGATC 
GAGTGCGTCA CGCCCGAAGG TGTGCGAACG GCCGACGGCA AGCTCCACGA ACTCGACATC 
CTGATCCTGG CGACGGGTTT CGATGCGGGA ACGGGTGCAC TGACGCGCAT CGACATCCGC 
GGTCGCGGCG GGCGCTCGCT CAAGGACGAC TGGGGCCGCG AGATCCGCAC CACGATGGGC 
CTGCAGGTGC ACGGCTATCC CAACCTCTTC ACGACCGGGG CGCCGCTGGC GCCGTCGGCG 
GCCTTCTGCA ACATGACCAC CTGCCTGCAG CAGCAGGTCG ACTGGATCAC CGAGTGCCTG 
GTGGCGCTGC GCCGTAAGGG CCTGACCGTC ATCGAGCCCA GCCGGGCGCT GGAAGACGAA 
TGGGTGGCTC ACCACGACGA GACCTCCAAC GCGACGCTGC TGGTCAAGAC CGATTCCTGG 
TACATGGGAA CCAATGTCAA GGGCAAGCAG CGCCGCATGC TTTCGTACAT CGGTGGGGTC 
GGAAAATACC GCCAACGCTG CGAAGAACTG GCCGCCGGCG GCTATCCGGG TTTCGAGATG 
CGCTGA

Protein sequence

MNDKTVAKTT RVDAVVIGAG IAGLYQVYRL REQGFDVQAF EAGSNVGGTW YWNRYPGARF 
DSTAEVYQFW FSEDLYKGWK PSERFPAQPE SERWLNYVAD RCDLRKHYRF STRVEAAHYD 
EAAQSWSITT DQGDTVQARF LITCCGMLSA PLTSVFPGQD SFKGQLFHTA RWPKEPVDFT 
GKRVGIVGTG ATGIQVIQTI ASQVGHLKVF LRTPQYTIPM NNPKYTEAVW AGFSSRFHEM 
KERVQRTFAG HVYDFGGYGT WAERTPEERI AVLEELWNDG SLALWLASFS EMFFDEKVNA 
EVSEFVRGKM RERLKDPVLC EKLIPTNYGF GTNRVPLDTN YLEAYHRPNV EIVDVKASPI 
ECVTPEGVRT ADGKLHELDI LILATGFDAG TGALTRIDIR GRGGRSLKDD WGREIRTTMG 
LQVHGYPNLF TTGAPLAPSA AFCNMTTCLQ QQVDWITECL VALRRKGLTV IEPSRALEDE 
WVAHHDETSN ATLLVKTDSW YMGTNVKGKQ RRMLSYIGGV GKYRQRCEEL AAGGYPGFEM 
R