Gene Noc_2046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2046
Symbol
ID	3705022
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2355175
End bp	2356176
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	58%
IMG OID	637738521
Product	zinc-containing alcohol dehydrogenase superfamily protein
Protein accession	YP_344036
Protein GI	77165511
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID	[TIGR02823] putative quinone oxidoreductase, YhdH/YhfP family

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATCTT TTCGGGGTCT GCGCATTGAC CGGGAGAAGG AGGGGATCCA GGCTCGCTTA 
GAAACCCTGC ATTTAGAGGA TCTTTCCCCC GGTTCGGTGG TGATCCGGGC TTATTATTCC 
AGCGTTAATT ACAAGGATGC CTTGGCGGCC ACCGGCAAGG GTAAGATTAT GCAGCGTTTC 
CCCCTGGTGG GCGGCATTGA TGTTTCAGGC GTGGTGGAGA GTTCGACCGA TCCCCGCTGT 
CGTCCGGGGG ACAAGGTGTT GGTCACTGGC TATGGGTTAG GCAGTGATCA TGACGGAGGT 
TATGCCGGCT ATGTTCGGGT GCCGGCGGAC TGGGTGGTGC CTTTGCCGGA GGGCTTAAGC 
CTGTATGACG CCATGGCGTT GGGGACCGCG GGCTTTACCG CTGCCCTAGC CATCCAGCGG 
ATGGAGGACA ATGGGCAGCG ACCGGATCGA GGTCTCGTCC TGGTCACGGG GGCGACAGGC 
GGCGTGGGGA ATCTGGCCAT CAATATGCTG GCCGGGCTCG GTTACCCGGT GGTGGCTCTG 
ACCGGTAAGC GGGAGGCAGT GGAAGATTTA AAAACCTTGG GCGCAAGCCA AATCTTATTT 
CGACAAGAAT TAGAAATGGG CCAACGTCCC CTGGAAAAAG GGCAATGGGG CGGGGCCGTG 
GATGTCGTCG GAGGAGATAT GCTGAGTTGG CTTACCCGGA CTGTGCTGCC CTGGGGCAAC 
ATCGCCAGTA TTGGTCTAGC GGGGGGGAGT GAGCTGCACA CCACGGTTAT GCCTTTTATT 
CTGCGGGGCG TGAGCCTGTT GGGGATTTCT TCCGCGGACT GTCCCATGCC CTTGCGCCAG 
CATATTTGGC AACGGTTAGC CACCGATTTG CGGCCTAGGC ACCTTAATCA AATTGTCACC 
GGAATGGTTT CCCTGGAGGA ATTATTACCC ATTTTTGAAG GCATGCTGGC GGGAGCTCAT 
CGGGGAAGAA CGGTGGTAAA AATCAGGGAC GATGAGGGTT AG

Protein sequence

MESFRGLRID REKEGIQARL ETLHLEDLSP GSVVIRAYYS SVNYKDALAA TGKGKIMQRF 
PLVGGIDVSG VVESSTDPRC RPGDKVLVTG YGLGSDHDGG YAGYVRVPAD WVVPLPEGLS 
LYDAMALGTA GFTAALAIQR MEDNGQRPDR GLVLVTGATG GVGNLAINML AGLGYPVVAL 
TGKREAVEDL KTLGASQILF RQELEMGQRP LEKGQWGGAV DVVGGDMLSW LTRTVLPWGN 
IASIGLAGGS ELHTTVMPFI LRGVSLLGIS SADCPMPLRQ HIWQRLATDL RPRHLNQIVT 
GMVSLEELLP IFEGMLAGAH RGRTVVKIRD DEG