Gene Noc_1394 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1394
Symbol
ID	3706080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1544221
End bp	1545333
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	51%
IMG OID	637737888
Product	zinc-containing alcohol dehydrogenase superfamily protein
Protein accession	YP_343417
Protein GI	77164892
COG category	[C] Energy production and conversion
COG ID	[COG1062] Zn-dependent alcohol dehydrogenases, class III
TIGRFAM ID	[TIGR02818] S-(hydroxymethyl)glutathione dehydrogenase/class III alcohol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0239994
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTAAAT CAAGAGCAGC CATTGCATGG GGACCGAAAC AACCCCTTTC CCTGGAAGAA 
GTGGAGGTAA TGCCGCCGCA AAAAGGGGAA GCATTGGTTC GTATCGCCGC CACTGGCGTG 
TGCCATACCG ATGCGTTTAC TTTGTCAGGC GAAGACCCGG AAGGTGTTTT TCCCGCTATC 
CTCGGTCATG AAGGAGGAGG GATCGTAGAG GCTATTGGCG AAGGCGTGAC CAGCGTCGCG 
GAAGGAGACC ATGTCATCCC CTTATATACG CCAGAGTGTG GCGGATGTAA ATTCTGCCTA 
TCCGGCAAAA CTAATCTATG CCAAAAAATT CGGGCGACTC AAGGAAAGGG GCTAATGCCA 
GATGGCACCA CCCGCTTCTA CAAAGCGGGC CAGCCCATCT ACCACTATAT GGGCTGCTCC 
ACTTTCTCCG AGTACACCAT ATTACCTGAA ATCTCGCTTG CGAAAGTGAA CAAGGAGGCT 
CCTCTGGAAG AGGTTTGCCT GCTGGGCTGT GGCGTCACCA CAGGTATAGG GGCCGTCATG 
AACACCGCTA AAGTGGAAGA AGGCGCCACG GTGGCTATTT TTGGTCTGGG AGGAATTGGT 
TTGGCAGCCA TTATTGGCGC CACTATGGCC AAAGCCAGCC GCATTATCGG GATCGATATC 
AATGAAGGTA AGTTTGAACT GGCCCGTAAG CTGGGGGCGA ACGACTGTAT CAATCCCCAA 
AACTACGATC GGCCTATCCA GGAAGTAATC ATCGAACTGA CTGGCGGTGG CGTGGATTAT 
TCCTTTGAAT GTATTGGTAA TGTTAAGGTT ATGCGTTCTG CATTGGAGTG TTGCCACAAA 
GGCTGGGGGG AATCGGTGAT TATTGGCGTT GCCGGCGCTG GCCAGGAAAT CTCTACCCGC 
CCATTTCAGT TGGTCACTGG ACGGGTATGG CGAGGTTCTG CATTTGGTGG CGTTAAAGGC 
CGCTCTGAGT TACCAGAATA TGTAGAACGT TACCTGAAAG GCGAATTCAA ACTCGATGAC 
TTTATTACCC ATACCATGGG GCTGGAAGAC ATCAATAAGG CTTTCGATCT AATGCATCAA 
GGCAAGAGTA TTCGTAGCGT CATTCATTAT TAA

Protein sequence

MIKSRAAIAW GPKQPLSLEE VEVMPPQKGE ALVRIAATGV CHTDAFTLSG EDPEGVFPAI 
LGHEGGGIVE AIGEGVTSVA EGDHVIPLYT PECGGCKFCL SGKTNLCQKI RATQGKGLMP 
DGTTRFYKAG QPIYHYMGCS TFSEYTILPE ISLAKVNKEA PLEEVCLLGC GVTTGIGAVM 
NTAKVEEGAT VAIFGLGGIG LAAIIGATMA KASRIIGIDI NEGKFELARK LGANDCINPQ 
NYDRPIQEVI IELTGGGVDY SFECIGNVKV MRSALECCHK GWGESVIIGV AGAGQEISTR 
PFQLVTGRVW RGSAFGGVKG RSELPEYVER YLKGEFKLDD FITHTMGLED INKAFDLMHQ 
GKSIRSVIHY