Gene Mpe_A0448 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0448
Symbol
ID	4785438
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	486361
End bp	487407
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	71%
IMG OID	640089006
Product	dihydroorotase
Protein accession	YP_001019645
Protein GI	124265641
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0418] Dihydroorotase
TIGRFAM ID	[TIGR00856] dihydroorotase, homodimeric type

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.953487
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTCTG CTGCCCCGGA CACCCTGACC CTGAGTCGGC CCGACGACTG GCACCTGCAC 
GTGCGCGATG GCGCCGCGCT GGCGGCCGTC GTGCCGCACA CCGCGCGACA GTTCGGCCGC 
GCGATCATCA TGCCCAATCT CAAGCCGCCG GTCACCACTG CGGCCCAGGC GCTGGCCTAC 
CGCGAGCGCA TCCTCGCGGC TGTGCCGGCC GGCCTCGCGT TCGAGCCGCT GATGACGCTC 
TACCTGACCG ACAACATGCC GCCCGAGGAG ATCGGCCGCG CGAAGGCGGC CGGCGTCGTG 
GCCGTCAAGC TCTACCCGGC GGGCGCCACC ACCAACAGCG ATGCCGGCGT GACCGACCTG 
CGCAAGACCC AGGCCACGCT CGAGGCGATG CAGCGCGAGG GCCTGCCTCT GCTGGTGCAC 
GGCGAGGTCA CCGATGCCGA GATCGACCTG TTCGACCGCG AGGCGGTGTT CATCGACCGC 
CAGCTGATCC CGCTGCGGCG CGACTTCCCG GCCCTGAAGA TCGTGTTCGA GCACATCACC 
ACCCGCGAGG CCGCGCAGTA CGTGGCCGGG GCCGGGCCGC ACACCGCGGC CACGATCACC 
GCCCACCACC TGCTCTACAA CCGCAACGCC ATCTTCACCG GCGGCATCCG GCCGCACTAC 
TACTGCCTGC CGGTGCTCAA GCGCGAGCTG CATCGCGAGG CGCTGGTGGC CGCCGCCACC 
TCGGGCAGCG ACCGCTATTT CCTCGGTACC GACAGCGCAC CGCATCCGGC CCACCTGAAA 
GAGCACGCCA GCGGCTGTGC CGGCTGCTAC ACCGCGTTCA GTGCGCTGGA GCTGTATGCC 
GAGGCCTTCG ACGCCGCCGG CGCGCTGGAT CGGCTGGAAG GCTTCGCCAG CGTCCACGGT 
CCGGCCTTCT ACGGCCTGCC GCGCAACGCC GGCACGGTGA CGCTGCGCCG GCAGGCCTGG 
ACGCCACCCG AGACGCTGCC GTTCGGCGAA GCGACGCTCA AGCCGCTGCG CGGCGGCGAG 
TCGCTGGCCT GGCGGCAGGT CGAGTGA

Protein sequence

MSSAAPDTLT LSRPDDWHLH VRDGAALAAV VPHTARQFGR AIIMPNLKPP VTTAAQALAY 
RERILAAVPA GLAFEPLMTL YLTDNMPPEE IGRAKAAGVV AVKLYPAGAT TNSDAGVTDL 
RKTQATLEAM QREGLPLLVH GEVTDAEIDL FDREAVFIDR QLIPLRRDFP ALKIVFEHIT 
TREAAQYVAG AGPHTAATIT AHHLLYNRNA IFTGGIRPHY YCLPVLKREL HREALVAAAT 
SGSDRYFLGT DSAPHPAHLK EHASGCAGCY TAFSALELYA EAFDAAGALD RLEGFASVHG 
PAFYGLPRNA GTVTLRRQAW TPPETLPFGE ATLKPLRGGE SLAWRQVE