Gene Noc_0472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0472
Symbol
ID	3706643
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	507877
End bp	508863
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	58%
IMG OID	637736981
Product	short chain dehydrogenase
Protein accession	YP_342525
Protein GI	77164000
COG category	[R] General function prediction only
COG ID	[COG4221] Short-chain alcohol dehydrogenase of unknown specificity
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTTTTT CACCCAAAGT CGTTGTGATC ACGGGCGCCT CCGCGGGGGT AGGTCGGGCA 
GTCGCCCAGG CGTTTGCTAG AGGCGGAGTC TCGATCGGAC TGCTGGCGCG GGGGCGTGAA 
GGATTAGAAG GGGCGTGCCG GGAAGTGGAA TCCCAGGGAG GAAAAGCTTT GATTCTCCCA 
ACGGATGTGG CTGATGCGGA TCAAGTGGAG GCGGCCGCGG CTGCCGTTGA AAAAGCCTTT 
GGCCCCATTG AGGTCTGGAT TAACGACGCC ATGACCAGCG TGTTCTCTCC GGTCAAGGAA 
ATGACCCCCG AGGAATTTCG CCGCGTCACC GAGGTGACCT ACCTCGGTTG CGTCAATGGG 
ACCCTGGCCG CCCTTAAGCG TATGCTACCC CGCAACCGAG GGGTGATTAT TCAGGTGGGT 
TCGGCTTTGG CCTATCGGGC CATCCCTTTG CAAGCCGCCT ATTGCGCGGC CAAACATGCC 
ATTCGGGGCT TTACCGATTC GCTGCGATGC GAACTGCTCC ATGAAAAATC CCAAGTCCGC 
GTGACCATGG TGCAAATGCC CGCGCTCAAT ACGCCTCAGT TTGACTGGAT TAAATCACGG 
CTGCCTCGCA AAGCCCAGCC CGTACCGCCA GTCTATCAGC CGGAAGTAGC GGCCCGGGCT 
ATTCTTTGGA CCGTCAGGCA TCCCTGCCGC GAGCTGAAGG TGGGACTGCC CACGATTTTA 
ATCGTAGCTA TCAATAAGTT CATGCCGGGC CTGCTAGATC ATTATTTAGC CCGCACTGGC 
TATCAGTCCC AGCAGCGGGA CGAACCGGAA GATCCTAACC GCCCCCACAA TCTTTGGAAT 
CCGGTCGCTG GGGATTTCGG CACCCACGGC AGCTTTGATG AGATAGCCCA TCGCGCCAGT 
ATCTCTCTTT GGGTAACCAC CCACCCCCGT TGGTTTGCCC TCGCGGCAGG GTTGATTTTA 
GCGCTGTTTA TTCTAGCTTT TTTATAA

Protein sequence

MPFSPKVVVI TGASAGVGRA VAQAFARGGV SIGLLARGRE GLEGACREVE SQGGKALILP 
TDVADADQVE AAAAAVEKAF GPIEVWINDA MTSVFSPVKE MTPEEFRRVT EVTYLGCVNG 
TLAALKRMLP RNRGVIIQVG SALAYRAIPL QAAYCAAKHA IRGFTDSLRC ELLHEKSQVR 
VTMVQMPALN TPQFDWIKSR LPRKAQPVPP VYQPEVAARA ILWTVRHPCR ELKVGLPTIL 
IVAINKFMPG LLDHYLARTG YQSQQRDEPE DPNRPHNLWN PVAGDFGTHG SFDEIAHRAS 
ISLWVTTHPR WFALAAGLIL ALFILAFL