Gene Mpe_A2138 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2138
Symbol
ID	4785802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	2294330
End bp	2295364
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	70%
IMG OID	640090706
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_001021329
Protein GI	124267325
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCTCA TTCCGTACGC GCTGACGCGC CCCTTCCTGT TCGGCCTGGA CGCCGAGCAC 
GCCCACGAAC TGACGCTGGC CTCGATCGCG CGGCTGCAGA ACACGCCGCT GCAGTGCCTG 
TGGCAGCAAC CGCGCATCGA CGATCCGGTC ACGCTGGCGG GCGTGCGCTT TCCCAACCGC 
ATCGGCCTGG CGGCTGGCCT CGACAAGAAC GGCCGCTGCA TCGACGGCTT CGGTGCCATG 
GGCTTCGGCT TCATCGAGGT GGGGACCGTC ACGCCCAAGG GACAGCCCGG CAACCCGAAG 
CCGCGCATCT TCCGCCTGCC GCAGGCCGAG GCGCTGATCA ACCGCCTGGG CTTCAACAAC 
GACGGCCTCG ACGCCTTTCT CGCCAATGTG CGGCGCGCCG GCTTCCGTCA GGGCGGTGGT 
GTGCTCGGCC TGAACATTGG CAAGAACGCC GCCACGCCGA TCGAGGACGC GGTCGACGAC 
TATCTGCTCG GCCTGGAGGG TGTGTACCCG CACGCCGACT ACGTGACGGT CAACATCTCC 
AGCCCGAACA CGCAGAACCT GCGCAGCCTG CAGAGCGACG CAGCTCTCGA TGCGCTGCTC 
GGCCGCCTGC AGGAGCGTCG CCAGCAGCTC ATCGCGCGGC ACGGCCGCAG CGTGCCGATG 
TTCGTGAAGA TCGCGCCCGA CCTCGACGAG GCCCAGGTCG ACGTGATCGC CGCCACCTTG 
AAGAAGAATG CCGTCGACGG CGTGATCGCC ACCAACACCA CGTTGTCGCG CGATGCCGTG 
CGGGGCCAGG CGCACGCCAC CGAGGTGGGC GGCCTGAGCG GCCGGCCGGT GTTCGAGGCC 
AGCAACCGCG TGGTCGGCCA GCTGCGCGCC GCGCTCGGCG CCGGCTATCC GATCATCGGC 
GTGGGCGGCG TGATGAGTGG CGCCGATGCG CGCGCCAAGC GCGACGTCGG CGCCGACGTG 
GTGCAGATCT ACACCGGCCT CATCTACCGC GGTCCGGCGC TGGTGAGCGA AGCGGCGCGC 
GCCCTGAAAG GCTGA

Protein sequence

MPLIPYALTR PFLFGLDAEH AHELTLASIA RLQNTPLQCL WQQPRIDDPV TLAGVRFPNR 
IGLAAGLDKN GRCIDGFGAM GFGFIEVGTV TPKGQPGNPK PRIFRLPQAE ALINRLGFNN 
DGLDAFLANV RRAGFRQGGG VLGLNIGKNA ATPIEDAVDD YLLGLEGVYP HADYVTVNIS 
SPNTQNLRSL QSDAALDALL GRLQERRQQL IARHGRSVPM FVKIAPDLDE AQVDVIAATL 
KKNAVDGVIA TNTTLSRDAV RGQAHATEVG GLSGRPVFEA SNRVVGQLRA ALGAGYPIIG 
VGGVMSGADA RAKRDVGADV VQIYTGLIYR GPALVSEAAR ALKG