Gene Mmar10_0518 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_0518
Symbol
ID	4285834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	+
Start bp	607909
End bp	608940
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	65%
IMG OID	638139983
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_755749
Protein GI	114569069
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.565795
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCACG ACCTGGCGAC CCGGATGCTG CATGGCCTCG ACCCGGAAAC CGCGCACCGT 
GTCGGCATTC TCGGTCTGAA GGCCGGGCTG GGGCCACGCC AGTTCCGACC GGACCCCGCC 
ATCCTGCGGA CCCGACTCGT CGGCCTAGAT CTGCCGAATC CGGTCGGCCT TGCGGCCGGT 
TTCGACAAGA ATGCCGAGGC GCCGGATGCC CTCCTTGCAG CGGGTTTCGG CTTCGTCGAA 
TGCGGCGCCG TGACCCCGCT TGCCCAGGAT GGCAAGCCGC GACCGCGGAT ATTCCGGCTC 
GACGCGGACC GGGCGGTCAT CAATCGCATG GGCTTTCCCA ATCAGGGATT GGCGCTGTTT 
CATCAGCGAC TGGTGCGTCG CTCGGCGCGG CTCGGCGTGG TCGGCGTCAA TCTGGGCGCC 
AATCTCGAGA GTGAGGACCG GATCGCTGAC TATGTCGCCT GTCTCGACGC GCTCAAGGAC 
CTGGCCCAGT TCTTCACGGT CAATGTGTCT TCTCCGAACA CGCCCGGCCT GCGCACGCTG 
CAATCATCAG GCGCGCTCGA TGATCTGCTG GCCGCCGTTG CCGCGGTCGG TGCCAAGGCG 
CCGGTCTTCC TGAAGATTGC GCCGGATATC GAAGATGCCG AGGCCGATGT CATGGTCGCC 
GCGATCACGC GTCACAAGCT CGACGGCATC ATCATTTCCA ACACCACCAT CACCCGCCCG 
GAAACCCTCG TCAGTGCGAA TATGGGTGAG GGGGGCGGCC TGTCCGGTCC GCCAGTCTTT 
GCCCGCTCGA CCGAACTCGT GCGCGCTTTC CGCAAGGCCG CGGGACCGGA CATGGCAATC 
ATCGGTGTCG GCGGCGTGTC CTGTGCCGAA ACCGCCTATG CCAAGATCCG GGCCGGTGCC 
AATGCGATCC AGCTCTATAC CGCGATGATT TATGAGGGGC CGGGCCTGAT CCAGCGGATC 
AAGCGCGGAC TGGTGGAACG GCTTCAGGTC GACGGGTTCG CATCGGTTGC CGACGCTGTC 
GGCGCCGAGT GA

Protein sequence

MIHDLATRML HGLDPETAHR VGILGLKAGL GPRQFRPDPA ILRTRLVGLD LPNPVGLAAG 
FDKNAEAPDA LLAAGFGFVE CGAVTPLAQD GKPRPRIFRL DADRAVINRM GFPNQGLALF 
HQRLVRRSAR LGVVGVNLGA NLESEDRIAD YVACLDALKD LAQFFTVNVS SPNTPGLRTL 
QSSGALDDLL AAVAAVGAKA PVFLKIAPDI EDAEADVMVA AITRHKLDGI IISNTTITRP 
ETLVSANMGE GGGLSGPPVF ARSTELVRAF RKAAGPDMAI IGVGGVSCAE TAYAKIRAGA 
NAIQLYTAMI YEGPGLIQRI KRGLVERLQV DGFASVADAV GAE