Gene Noc_A0008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_A0008
Symbol
ID	3704296
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007483
Strand	-
Start bp	5468
End bp	6664
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	52%
IMG OID	637736503
Product	endonuclease/exonuclease/phosphatase
Protein accession	YP_342051
Protein GI	77163525
COG category	[R] General function prediction only
COG ID	[COG3568] Metal-dependent hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.203843
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCAAGC GGTTATTAAT CTTATTTTTT CTTTTTCTAC CCACTATCTC AGCGCAAGCG 
TTCACCATTG CAAGCTGGAA TACCAAACAT TTAGGGTGGG GAGACAAGAG GAACTGGAAC 
GCAACCGCGG CGGTCGTAGC ACCCTACGAT TTTGTCGCCC TCCAGGAGGT AATGAGTAAA 
ACGGCCGTCA ACCATCTGGT CCAGACGCTG AAGAAGCAGA CCGGAGTAAA ATGGTCCTCA 
CTGGTTTCGG GAACCAGCGT AGGACGCTCG AAACGTTACC AGGAATTCTA TGCTTTCATC 
TGGCGTGAAG AGGCTGTCGA TTATGTGGGC GGCGCTGTGG TCTATTTAGA CCCAGGCGAT 
ATCTTTGCGC GGGAGCCTTT TGCAGCACGG TTTCAGACAG ATAATGGAAA GTATCGTTGG 
ACTGCGGCCA CCGTACATGT GGTCTATGGA GATAGCCGGG ATGAGCGGCG CCGAGAAGCA 
CAGCAGCTTG ATGAGTATGT AAACTGGCTA GAGGAAAACG TCGCTGAAGG AGATCCGGTG 
GTTCTGATGG GCGACTTCAA CCTACCCCCG GATTCAGCGG GATTCCGGGA TCTGGCTAAA 
GTACTTAAAC CCGCTATCCG GGAAGGGGCA ACGACTCTGT CCGCCAAAGA GGGCCGGTAC 
GCCAATCTCT ACGATAATAT CTGGTACCGA CCGGATGCCT TGAAAATCCA GGAAGCCCGG 
ATCGATCGTT TCCCTCAGCG TTTGGGAATT ACTCACAAGC TAGCTCGAAA AACCGTCAGT 
GACCATGCTC CCGTGGTGAT TGTGCTTGGT GATCCGGTAT CCCCATCTCC AAAAGGAAAA 
TTGAATGGCG CACAGACAAC CTCTTCAGCC GAGCGAAAGG CAACATTAGC AATTATTTGC 
GTGCATCCCG ATGCGCCTGG AAACGATAAC AAAAATCTGG CCGGTGAATG GGTGGAGATA 
CAGAATTCTG GCGCTCAGCA TCTGGATTTA ACCGGCTGGA TACTGGCGGA TGAAGCGGAC 
CATAAGATTG CCTTACAAGG CAGCCTTAAT GCTGGCGGTA CCCTTCGGAT AGACTCCACC 
GCAATAGGAC GCCCTATATG GAATAATTCG GGGGATACGG CGATTTTGCG TGATCCAGAG 
GGGACTGTGG TCTCAACGCT GCGCTACCCC GGCGGGAGAA TTTGCGAAGA TCGCTAA

Protein sequence

MGKRLLILFF LFLPTISAQA FTIASWNTKH LGWGDKRNWN ATAAVVAPYD FVALQEVMSK 
TAVNHLVQTL KKQTGVKWSS LVSGTSVGRS KRYQEFYAFI WREEAVDYVG GAVVYLDPGD 
IFAREPFAAR FQTDNGKYRW TAATVHVVYG DSRDERRREA QQLDEYVNWL EENVAEGDPV 
VLMGDFNLPP DSAGFRDLAK VLKPAIREGA TTLSAKEGRY ANLYDNIWYR PDALKIQEAR 
IDRFPQRLGI THKLARKTVS DHAPVVIVLG DPVSPSPKGK LNGAQTTSSA ERKATLAIIC 
VHPDAPGNDN KNLAGEWVEI QNSGAQHLDL TGWILADEAD HKIALQGSLN AGGTLRIDST 
AIGRPIWNNS GDTAILRDPE GTVVSTLRYP GGRICEDR