Gene M446_2543 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_2543
Symbol
ID	6132533
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	2817295
End bp	2818806
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	74%
IMG OID	641642752
Product	dihydropyrimidinase
Protein accession	YP_001769417
Protein GI	170740762
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type [TIGR02033] D-hydantoinase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.65839
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCAG CCAGCCACGA CCGCGATTTC GATCTCGTCG TCCGAGGGGG GCTGCTCGCC 
ACCGCGGCCG AGACCTTCGA GGCAGATCTC GCGATCAGGG ACGGTCGCAT CGCCGCGATC 
GGCCGCGCGC TCCGCCCGGG CGCCGAGGAG ATCGACGCCA AGGGCCTCGT CGTGACCCCG 
GGCGGGCTCG ACCCGCATTG CCACATCGAG GAGCCCTCGG AGGCGGGCGG CGTCCAGGAG 
GAGAGTTTCG CCTCGGGCTC CGCGGCGGCG CTCGCCGGGG GCACCACCTC CTTCATCTGC 
TTCGTGCCGC AATGGAAGGG TCACCCGATC GCCCGCACGG CGCCCGGCTA CGAGGCGCGC 
GCCCGCGCCT CGCGGGCCGA TTACGGCTTC CACCAGATCA TCACCGACCC GACGCCGGAG 
GTGCTGGAGC GCGAGGTGCC GGCCCTGGTG GCGCGCGGCA TCCGCAGCCT CAAGGTCTTC 
CTCACCTACG ATCCGCTGCG GCTGACCGAC GGCCAGTACC TGGAGGTGCT GGCGACGGCG 
CGCCGGCTCG GCGCGCTCGT CACCGTGCAT TGCGAGAATT TCGACGCGAT CGGCTGGCGC 
ATCCGGGCCC TCCTGGCGGC GGGCCTGACC GATCCGCTCC AGCACGCCTG GGCGCGCCCG 
CCCGTGGTCG AGCGGGAGGC GACGCACCGC GCCATCGCGC TCGCCGAACT CGTCGACCAG 
CCGATCCAGA TCTTCCACGT CTCCTGCGAC GAGGCGGCCG AGGAGATCGC CCGCGCGCGG 
GCCCGCGGCG TCAAGGTCTG GGGCGAGACC TGCCCGCAAT ACCTCACCCT CTCGACGGAG 
GATCTGGCGC GGCCGGATTT CGAGGGCGCG AAGGTGGTCT GCTCGCCGGC CCTGCGGGCG 
CCGGCCGAGC GGGAGCGGAT CTGGGCGCGG ATCGCGGACG GGACGCTCGA CATCGTCTCC 
TCCGACCATT GCGGCTTCTC CTTCGCCACC GCCAAGCGCG ACCCGGGGAG CAGCGGCTAC 
GGCCAGGGCG GGGCCGAGGC GCGGCCGGAC GGGATGCCGG CCTTCAACGC CATCCCGAAC 
GGCGTGCCGG GCATCGAGAC GCGGCTGCCG CTGCTGTTCT CCGAGGGGGT TTCCAAGGGC 
CGGATCGACC TGCCCACCTT CGTGCGCCTG ACCTCGGCCA ACGCGGCGCG GCTGTTCGGC 
CTCGCCGGCC GCAAGGGCAC GCTGGCGCCG GGCGCCGATG CCGACCTCGT TCTCTGGGAC 
CCCTCGGCCG AGCGCCGGAT TCGCAACGCG GCGCTCCACC ACGCCATCGA CTACACGCCG 
TGGGAGGGGC TCGCCGTGAC GGGCTGGCCC GCCACGGTGA TCCGCCGGGG CGAGGTCGCG 
GTGCGCGACG GCGCCGTCCT GGCCGAGCCC GGTTCCGGGC GCTTCCTCGC CCGCGGGCCC 
TACCCGCTCG TGCGCCCGAC CGGGCGGGTG CCGGACGGAT TCGATGCCGC GGCCGTGCCG 
CCCCGGAGCT GA

Protein sequence

MPPASHDRDF DLVVRGGLLA TAAETFEADL AIRDGRIAAI GRALRPGAEE IDAKGLVVTP 
GGLDPHCHIE EPSEAGGVQE ESFASGSAAA LAGGTTSFIC FVPQWKGHPI ARTAPGYEAR 
ARASRADYGF HQIITDPTPE VLEREVPALV ARGIRSLKVF LTYDPLRLTD GQYLEVLATA 
RRLGALVTVH CENFDAIGWR IRALLAAGLT DPLQHAWARP PVVEREATHR AIALAELVDQ 
PIQIFHVSCD EAAEEIARAR ARGVKVWGET CPQYLTLSTE DLARPDFEGA KVVCSPALRA 
PAERERIWAR IADGTLDIVS SDHCGFSFAT AKRDPGSSGY GQGGAEARPD GMPAFNAIPN 
GVPGIETRLP LLFSEGVSKG RIDLPTFVRL TSANAARLFG LAGRKGTLAP GADADLVLWD 
PSAERRIRNA ALHHAIDYTP WEGLAVTGWP ATVIRRGEVA VRDGAVLAEP GSGRFLARGP 
YPLVRPTGRV PDGFDAAAVP PRS