Gene Noc_1078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1078
Symbol
ID	3707203
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1183345
End bp	1184376
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	54%
IMG OID	637737580
Product	putative dehydrogenase
Protein accession	YP_343113
Protein GI	77164588
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTACCC CGCCACCACG CTTAGTCCCA TCTATTGCCC GGGCTTATTG GGTGGAAGCG 
TCCGGGAAAG GCGCCATTCG CCAGGAAACG CTCTCTGTGC CGGTACCAGT GGGTTATAGC 
CTCCTTGAAA CCTGGCTAAC TGGAATCAGC CCTGGGACAG AGCGATTGGT CGGATTGGGG 
AAGGTACCCG CGGAATGCCA GCAAGCCATG GCTTGCCCTG CTATGGGGGG ATCATTCAAG 
CTGCCAGTCA AATACGGATA TTGCCTCCTA GGCCAGGCTA TTAATGGCCC CTACGCTGAC 
CAGCTCGTCT TTACCATGCA TCCCCACCAA GATTACGCAA TTGTCCCCAA TAAGCAACTA 
TTACCCCTCC CTCAGGATAT ACCCCCTCTA CGGGCTACGC TGCTTCCTAA CCTGGAAACC 
GCCCTGAACG CCATTTGGGA CAGCGAATAC CAGGCGCCAG CGCCGGTAGC CATCGTCGGT 
GGCGGCATTG TGGGCTTGCT TATCGCCTTT TTGCTCAAAA CCGCCTGGGA TGCCTTCCCT 
ATTATCATTG AGCGCGATCC GCAGCGTCGG CAACTCATTG AAAAACTAGG ATGGGGACTT 
ACTGTCCTTG AAGTCCAGGA GGCCCCCCAG GGGGTATTTT CCCTCTGTTT TCATGCCTCG 
GGACAAGGAG CAGGACTGCA AACAGCCTTG GATAGCGTGG GGTTTGAAGG AAAAGTCATT 
GAGGTGAGCT GGTTGGCTCA TCAGCCAGTC ACCCTTAACC TGGGCGGATC TTTTCACTTC 
CAAAGGAAAC AGATTCTCTC TTCCCAAGTC AGCACGATTG CCAAACCCAA GCGGGAACAT 
ACGAGCCACC AGCAGCGTTT AGAGCAGACC CTGAATTATT TGCAAAGCCC CTTACTTGAT 
GCTCTTATTG CCCCAGCGAT CACCTTTGAG AGCCTGCCTC TTTTTATGCA GGAACTCTAC 
CATAAAAATC CGGTCGACTT TTCCTTTGCC GTGACCTATC CACCCTTTCA TCCTCGACTC 
CACAAAGCCT AA

Protein sequence

MSTPPPRLVP SIARAYWVEA SGKGAIRQET LSVPVPVGYS LLETWLTGIS PGTERLVGLG 
KVPAECQQAM ACPAMGGSFK LPVKYGYCLL GQAINGPYAD QLVFTMHPHQ DYAIVPNKQL 
LPLPQDIPPL RATLLPNLET ALNAIWDSEY QAPAPVAIVG GGIVGLLIAF LLKTAWDAFP 
IIIERDPQRR QLIEKLGWGL TVLEVQEAPQ GVFSLCFHAS GQGAGLQTAL DSVGFEGKVI 
EVSWLAHQPV TLNLGGSFHF QRKQILSSQV STIAKPKREH TSHQQRLEQT LNYLQSPLLD 
ALIAPAITFE SLPLFMQELY HKNPVDFSFA VTYPPFHPRL HKA