Gene Noc_0435 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0435
Symbol
ID	3706606
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	473378
End bp	474433
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	58%
IMG OID	637736945
Product	zinc-containing alcohol dehydrogenase superfamily protein
Protein accession	YP_342489
Protein GI	77163964
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.692768
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGCAT TCGTAATGTT AAACATCGGG CAAGTGGGGG TCGTTGAAAA GGATCGTCCG 
ACCTGTGGGC CTCTGGACGC GATCCTGCGT CCGACGAAGG GGCTGATCTG CACATCTGAT 
GTGCATACCG TCCATGGTGC GGTTGGAGAA CGGGAGAACC TCACCCTGGG ACATGAAGCT 
GTCGGCGTGG TCGAGGAAGT TGGAGCGCTA GTCGCCAACT TCAAACAGGG AGACCGGGTA 
GCGGTGGGTG CTATCACCCC GGACTGGGGT TCAGACGCTG CCCAGGGAGG CCATTCATCG 
CAGTCTGGTG GAGCACTGGG AGGCTGGAAG TTTGCCAATA TCAAAGACGG CACCTTTGCC 
GAGTACGTAC ATGTCAACGA AGCAGACGCC AACCTCGCGC TGATCCCCAA GGGTGTGCCA 
GACGAGTCGG CTGTGTATGT GTGTGACATG ATGAGCACTG GATTCATGGC CGCAGAGAAC 
GCCAAAATCC CCATCGGTGG CAATGTCGTA GTCTTCGCCC AGGGACCCGT GGGCCTCATG 
TGCACTGTGG GAGCACGACT GCAGGGCGCC GGTTTCGTGA TCGCGGTTGA AAGCGTGCCC 
AAGCGCCAGG AGCTGGCCCG GCACTTCGGG GCCGACGAGG TGGTGGACTT TACCAAGGTG 
GACGTGGTAG AGCGGATTCT TGAGCTCACG AACGGCGAAG GCGTGGATGC GGCCATCGAT 
GCGCTAGGCA CATCCCAGGT GCTCCAACAG TGCGTCAAGG TGACCAAGCC CGGCGGTATG 
ATCTCCAACG CTGGTTACCA TGGTGATGGC GAATTTGTCG AAATCCCCCG CGTGGAGTGG 
GGCGTCGGAA TGGCGGAGAA GGACATCGCG ACGGGTCTCT GCCCAGGCGG ACACCTACGG 
CTCTCCCGTT TACTGAGGTT GCTGGAAACC GGGCGGATCG ATCCCACTCC GATGACTACC 
CATACCTTTG GATTCGATGA AATCGAGAAG GCATTCCGCA TGATGGAGAA AAAAGAGGAC 
GGTATGATCA AACCGATGAT TGATTTCGAA GCCTGA

Protein sequence

MKAFVMLNIG QVGVVEKDRP TCGPLDAILR PTKGLICTSD VHTVHGAVGE RENLTLGHEA 
VGVVEEVGAL VANFKQGDRV AVGAITPDWG SDAAQGGHSS QSGGALGGWK FANIKDGTFA 
EYVHVNEADA NLALIPKGVP DESAVYVCDM MSTGFMAAEN AKIPIGGNVV VFAQGPVGLM 
CTVGARLQGA GFVIAVESVP KRQELARHFG ADEVVDFTKV DVVERILELT NGEGVDAAID 
ALGTSQVLQQ CVKVTKPGGM ISNAGYHGDG EFVEIPRVEW GVGMAEKDIA TGLCPGGHLR 
LSRLLRLLET GRIDPTPMTT HTFGFDEIEK AFRMMEKKED GMIKPMIDFE A