Gene Noc_3046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_3046
Symbol
ID	3704345
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	3440857
End bp	3442455
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	49%
IMG OID	637739520
Product	cytochrome c oxidase
Protein accession	YP_345017
Protein GI	77166492
COG category	[C] Energy production and conversion
COG ID	[COG0843] Heme/copper-type cytochrome/quinol oxidases, subunit 1
TIGRFAM ID	[TIGR02891] cytochrome c oxidase, subunit I

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00000491174
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACAG TAGCAGCACA CGGTGATCAC GCGCATCACC CTACCGGCAT CATGCGCTGG 
TTGACAACCA CCAACCATAA GGATATTGGT ACCTTATACC TGTTTTTTAG CCTTACTATG 
TTTTTTGTTG GCGGCGCGAT GGCGCTGACA TTCCGTACCG AACTTTTTGC GCCTGGATTA 
CAAATTCTAG ATCCCCAAAG ATTTAATGAG TTGGTGACCC TGCATGGGTT AGTCATGATC 
TTTGGCGCGA TGATGCCCGT TCTAGCGGGT TTAGCTAACT GGCAAATACC GCTTATGATT 
GGCGCGCCTG ATATGGCTTT GCCGCGGTTA AATAACTGGA GCTTCTGGCT CTTACCCTTT 
GCCATGCTTT TGCTTCTTAG CAGTTTGCTG GTGCCGGGCG GAGCAGCGGC TGGGGGATGG 
ACCATGTACC CACCCTTGTT TATCCAGGGC GGGGTTGGCA TTGATATGAC CATCTTTTCT 
GTCCATCTTC TGGGACTTTC TTCCATATTG GCGTCGATCA ATATTATTGT TACCGTCCTA 
AACATGCGAG CACCTGGCAT GGGTCTGATG AAAATGCCTA TGTTCGTCTG GGGATGGTTG 
ATCACTGCCT TTTTGCTGGT TGCGGTGGCT CCGGTACTTG CGGGCGCCGT GACCATGGAG 
CTTACCGACC GTCATTTTGG CACCAGTTTC TTTAATGCGG CTGGCGGCGG TGACCCGGTG 
ATGTACCAGC ACATTTTCTG GTTTTTTGGC CATCCCGAAG TCTATATTAT GGTTTTACCT 
ATTTTCGGGG TGATATCGGA TATTATTCCG ACTTTTGCCC GTAAGCCAAT ATTTGGCTAT 
CACTCCATGG TCTACGCTTT AGCTTCGATT GCCTTCCTCT CCTTCATCGT GTGGGCGCAT 
CACATGTTTA CCGTCGGCAT GCCGCTTTCA GGAGAGTTGT ACTTTATGTA TGCAACCGTC 
CTGATTTCCG TTCCCACTGG GATCAAAATT TTTAATTGGC TTACCACCAT GTGGCGGGGT 
TCCATGACTT TTGAGTTGCC CATGCTGTGG TCTATGGCCT TCATCGCTTT ATTTACTATT 
GGCGGCCTGA CTGGCCTTAT GATGGGCGTA GCCGCGGCGG ATTTTCAGTA CCATGATACC 
TATTTTATTG TTTCCCACTT CCACTATGTA TTTCTGCCGG TGACGCTATT TGGTACCTAT 
GCTGCTGTTT ACTACTGGCT ACCTAAATGG ACTGGTAATT GGTATGACGC GCGTCTAGGG 
AAATGGCATT TCTGGCTGTC CGTAATTTCA ATGAATATCG TTTTCTTTCC GCAGAATTTC 
CTTGGCTTGG CGGGCATGCC GCGGCGAATT CCTGACTACG CCATTCAGTT CGCTGAATTC 
AATGCGATTT CCACCATAGG TGCTTTCATT TTCGGTTTCT CTCAGTTGAT CTTTGTATAT 
GTGATTATTA AGGCTATTCG TGGTGGCGCA GGTGTGGAAA AAGCTACCGA CCAGGTATGG 
GAAGGCGCAA AGGGTTTAGA GTGGACACTT AGCTCTCCGC CCCCTTACCA TAGTTTCACA 
ACTCCACCCC AAGTCACGGC GGAGAATAAT CCCCATTAA

Protein sequence

MSTVAAHGDH AHHPTGIMRW LTTTNHKDIG TLYLFFSLTM FFVGGAMALT FRTELFAPGL 
QILDPQRFNE LVTLHGLVMI FGAMMPVLAG LANWQIPLMI GAPDMALPRL NNWSFWLLPF 
AMLLLLSSLL VPGGAAAGGW TMYPPLFIQG GVGIDMTIFS VHLLGLSSIL ASINIIVTVL 
NMRAPGMGLM KMPMFVWGWL ITAFLLVAVA PVLAGAVTME LTDRHFGTSF FNAAGGGDPV 
MYQHIFWFFG HPEVYIMVLP IFGVISDIIP TFARKPIFGY HSMVYALASI AFLSFIVWAH 
HMFTVGMPLS GELYFMYATV LISVPTGIKI FNWLTTMWRG SMTFELPMLW SMAFIALFTI 
GGLTGLMMGV AAADFQYHDT YFIVSHFHYV FLPVTLFGTY AAVYYWLPKW TGNWYDARLG 
KWHFWLSVIS MNIVFFPQNF LGLAGMPRRI PDYAIQFAEF NAISTIGAFI FGFSQLIFVY 
VIIKAIRGGA GVEKATDQVW EGAKGLEWTL SSPPPYHSFT TPPQVTAENN PH