Gene Noc_2551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2551
Symbol
ID	3704554
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2901256
End bp	2902254
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	53%
IMG OID	637739030
Product	zinc-containing alcohol dehydrogenase superfamily protein
Protein accession	YP_344534
Protein GI	77166009
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCCA TAATCATGAC AGCAACGGGA GGCCCCGACG TCTTGCAACT GCAAGAGTTG 
CCGAAGCCTA CAATCCGTCA ACCCGGGGAA GTTCTGGTTC AGCTCAAAGG GGCTGGAATT 
AACCCGGTGG ACACCAAATT GCGAACTCGA GGTACTTTCT ACCCAGACCG CTCCCCGACA 
ATCCTCGGTT GCGATGGGGC GGGCGTTGTG GATGCTGTGG GCAGAGAGGT TAAAAATTTC 
CAGAAGGGAG ATGAGGTTTA TTTCTGCTTC GGGGGAATTG GAGGTCCGGA AGGGAACTAT 
GGGGAATATG CGGTAGTAGA CCATCGCTTT ATCGCTAAAA AACCAAGAAC GCTCTCCTTT 
GCCGAAGCTA GCGCTGCCCC CCTGGTTTTG ATAACCGCTT GGGAAGCACT GCATGATCGG 
GCGCGAATCC AGCCAGAGGA TACAGTATTG ATTCATGGCG GCGCAGGCGG TGTAGGCCAT 
GTAGCCATTC AATTAGCCAA ACAGACCGGT GCTCGGGTCT GCGTCACCGT GAGCTGCGAA 
GAAAAAGAGG AACTTGCCTG CTCCTTGGGA GCAGACCATA TCATCAACTA TCGCCAAACC 
GATTTCGTTG AAGCCATTAT GGAATGGACC AGCGGTAAAG GGGTGGACGT GGTATTTGAT 
ACGGTGGGGG GAGAAATTTT TGAAAAGAGC TGTGGAGCCG TCGCCATGTA TGGAGATTTA 
GTCACCCTCT TACAGCCGAG TGCCAACATA AATTGGAATA CGGCGCGTGC GCGTAATCTC 
CGCTTTAGTC TGGAATTGAT GCTGACTCCT ATGCACCGGG GCCTTATCTC TGCCTTAGAA 
CATCAAGCAG ATATTCTGCA TTGCTGCGCT GAATTATTCG ACTCCGAGCG TCTTCGGCTT 
CACTTCCAGC AAACCTTTCC CCTAGCGGAA GCAGCGGCTG CCCACCGTTT GCTGGAACGG 
GGAGGAATGA TGGGTAAATT AGCCCTTGAG ATGGGTTAG

Protein sequence

MKAIIMTATG GPDVLQLQEL PKPTIRQPGE VLVQLKGAGI NPVDTKLRTR GTFYPDRSPT 
ILGCDGAGVV DAVGREVKNF QKGDEVYFCF GGIGGPEGNY GEYAVVDHRF IAKKPRTLSF 
AEASAAPLVL ITAWEALHDR ARIQPEDTVL IHGGAGGVGH VAIQLAKQTG ARVCVTVSCE 
EKEELACSLG ADHIINYRQT DFVEAIMEWT SGKGVDVVFD TVGGEIFEKS CGAVAMYGDL 
VTLLQPSANI NWNTARARNL RFSLELMLTP MHRGLISALE HQADILHCCA ELFDSERLRL 
HFQQTFPLAE AAAAHRLLER GGMMGKLALE MG