Gene Noc_2822 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2822
Symbol
ID	3705571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	3198590
End bp	3199585
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	52%
IMG OID	637739298
Product	dihydroorotate dehydrogenase 1
Protein accession	YP_344799
Protein GI	77166274
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01037] dihydroorotate dehydrogenase (subfamily 1) family protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0209539
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGAAA CATTCAATAC TGACTTAAGT GATACCGATT GGGCAAGGCT AAAGGTTGAT 
TTTTGTGGGC TGGAGCTGCA AAGCCCCTTA GTATTGCTTT CAGGTTGCGT CGGTTTTGGG 
GAAGAATATA CTCGGGTAGT GGGTTTCTCC AACCGGGAGG TGGGAGCGGT ATGTCTCAAG 
GGAACCACGG CGGCTCCCCG CTTGGGAAAT GCCCTCCATC GGATTTATGA AACGCCCATG 
GGCATGCTCA ATGCCATTGG CCTGCAAAAT CCCGGCGTAG ATTATGTAGT CGATCATATC 
TTGCCAGCGC TTGACTTTAG CGAAACCCGC TATATCGCCA ATGTTTCTGG CTCCACTATT 
GAAGAGTATA CGGCAGTCAC CCGCCGCTTC GACAATTCCC CAATTGATGC CATAGAAATC 
AATATTTCTT GCCCTAATGT AAAAGAAGGG GGCGTTGCTT TTGGCAACGA TCCCCATATG 
TCGGCGCGGG TGGTGGAGGC CTGTCGAAAG GTGACCCGTA AACCCCTGAT CACCAAGCTT 
TCCCCTAACC AAACCTCAAT AGAAGAAAAT GCCCGTCGCT GTATCGAAGC GGGAACGGAT 
GGGTTTGCCG TCATCAATAC CTTGATGGGA ATGGCCATTG ATATAGAGCA GCGCACTCCG 
CTTCTCGGAA ATATCCAGGG GGGATTGTCG GGGCCCGCCA TAAAGCCGAT TGCCTTACTC 
AAGGTGCGTC AAGTCTATCA GGCATGCCGG GCGCATGGCA TCCCAATTAT TGGGCAGGGG 
GGAGTCGCTT CTGGCAAAGA TGCTCTGGAA TTTCTCATTG CGGGCGCTAC TACGGTGGGA 
GTAGGTACCG CCTTGTTTTA TGACCCTTTG CTTTGCGCCA AAATCAACGC GGAAATTGTA 
GCTTACCTCA AGCGCCATGA CTTGAGAGCG GTGGCGCAAT TGACGGGCAG CTTGCGTTTA 
GCGGAGGAAG TCTCGGACTG TGTTGTGAGT GGCTAA

Protein sequence

MAETFNTDLS DTDWARLKVD FCGLELQSPL VLLSGCVGFG EEYTRVVGFS NREVGAVCLK 
GTTAAPRLGN ALHRIYETPM GMLNAIGLQN PGVDYVVDHI LPALDFSETR YIANVSGSTI 
EEYTAVTRRF DNSPIDAIEI NISCPNVKEG GVAFGNDPHM SARVVEACRK VTRKPLITKL 
SPNQTSIEEN ARRCIEAGTD GFAVINTLMG MAIDIEQRTP LLGNIQGGLS GPAIKPIALL 
KVRQVYQACR AHGIPIIGQG GVASGKDALE FLIAGATTVG VGTALFYDPL LCAKINAEIV 
AYLKRHDLRA VAQLTGSLRL AEEVSDCVVS G