Gene Caul_0388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0388
Symbol
ID	5897662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	426729
End bp	427793
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	71%
IMG OID	641560873
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_001682023
Protein GI	167644360
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTTC ACGACATCGC CGCCCGCGCC CTGCACGTCC TGGACCCCGA GGACGCCCAC 
GGCTGGGCGA TCAAGGGCCT GAAGATGGGA TTGGGTCCGC GCCAGTCCGA CGTCGACGAT 
CCGATCCTGT CGCTGACCGT CGCCGGCCTG CCGCTGTCCA ACTGCGTGGG CCTGGCCGCC 
GGCTTCGACA AGAACGCCGA GGTCCCCGCC GCCATGTCGC GGGCCGGCTT CGGCTTCGTC 
GAGTGCGGTA CGGTCACGCC CCTGGCCCAG GCCGGCAATC CGCGCCCGCG CCTGTTCCGG 
CTGACCCAGG ACCAGGCGGT GATCAATCGC ATGGGCTTCA ATAACGAGGG CCTGGAGCCG 
TTCGCGGCCC GCCTGTCGGC TCTGAAGGCC CGACGCACGC GCGGGATCGT CGGCGCCAAT 
ATCGGGGCCA ACAAGGACGC GACCGACCGC ATCGCCGACT ATGTCACGGG CCTTACCCGC 
CTGTGGGGCC TGTCGGACTA TTTCACCGTC AATATCTCCT CGCCCAACAC GCCGGGGCTG 
CGCGCCCTGC AGACCAAGGC GGCGCTGGAG GAACTGCTGG GCCGCCTCGC CGAGGCGCGC 
GGCCTGCTGA AGGCTGCCGG CACGGTCGAC TATCCGATCT TCCTGAAGGT CGCGCCAGAC 
CTGGAGGACG GGGAGGTCGA GGCCATCGTC GAGACGGTCA AGAGCGCCGG CCTGAACGGG 
ATCATCGTCA GCAACACCAC GATCGCCCGC CCCGCCGACC TGGCCTCCCC CCACGCCGCC 
GAGAGCGGCG GTCTTTCGGG CAAGCCGCTG CTGGCCGCTT CCACCGCCAT GCTGGCCCGT 
TTCCACGCCG CCAACAACGG ACACCTAGCC TTGATCGGGG CGGGCGGGAT CGCCAGCGGC 
GCCGACGCTC TGGCCAAGAT CCGGGCCGGC GCCTGCGCCG TGCAGCTCTA TTCAGCCCTC 
GTCTACGGCG GGCCGGGCCT GGTCCAGCGG ATCAAGTCGG ACCTGGCCGC CCGCCTGCGC 
GCCGAGGGCT TCGCCTCGGT CACTGACGCG ATCGGCGCGG CATGA

Protein sequence

MSLHDIAARA LHVLDPEDAH GWAIKGLKMG LGPRQSDVDD PILSLTVAGL PLSNCVGLAA 
GFDKNAEVPA AMSRAGFGFV ECGTVTPLAQ AGNPRPRLFR LTQDQAVINR MGFNNEGLEP 
FAARLSALKA RRTRGIVGAN IGANKDATDR IADYVTGLTR LWGLSDYFTV NISSPNTPGL 
RALQTKAALE ELLGRLAEAR GLLKAAGTVD YPIFLKVAPD LEDGEVEAIV ETVKSAGLNG 
IIVSNTTIAR PADLASPHAA ESGGLSGKPL LAASTAMLAR FHAANNGHLA LIGAGGIASG 
ADALAKIRAG ACAVQLYSAL VYGGPGLVQR IKSDLAARLR AEGFASVTDA IGAA