Gene Noc_3040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_3040
Symbol
ID	3704339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	3436182
End bp	3437210
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	50%
IMG OID	637739514
Product	cytochrome oxidase assembly
Protein accession	YP_345011
Protein GI	77166486
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1612] Uncharacterized protein required for cytochrome oxidase assembly
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00748587
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCGCC GGTTTTATGT TTTTGCTTTA GCAGCTAGCC TATTAGCCCT GGTCGTTGTG 
GTGGTAGGCG CTTATGTGCG CCTTTCTGAT GCTGGATTAA GCTGCCCGGA TTGGCCAGGT 
TGTTACCAAA AGCTATTAGC ACCTACCACT GAGCAGCAGG TTGATCATGC TAATCGCCTC 
TATCCGGATC GCCCGGTGGA GACAGCTAAA GCCTGGAAAG AAATGATCCA TCGCTACCTC 
GCGGGTATCT TGGGATTATT GATTTTAGGG CTTGCTATTG CCGCCTGGCG TAACCGTTCT 
GATCCCACTC AGAAAGTGGC TCTGCCCTTA TTTTTACTTG GATTAGTGGG GTTGCAAGCT 
GCGTTGGGGA TGTGGACCGT TACTCTCTTG GTGCAGCCGG CTATTGTGAC GTTACATCTT 
CTAGGAGGAA TGGCGGTTCT AGCCTTGGTT TGGTGGCTAG CATTGCGGCA GCGACAGGCA 
CGACGCCCTA TGGAGAAAAT CTGGTATTCA CCAGCTTTTA AGCTTTTGGC ATTAATAGGC 
TTATTTCTGC TAGTACTGCA AATCATCCTT GGAGGTTGGA CAAGCACCAA TTATGCGGGC 
TTCTATTGTT CGGATTTTCC CACCTGCCAA GGGCAGTGGT GGCCAACCAT GGATTTTCGT 
GAGGCTTTCA CATTTTGGCA GCCGCTAGGG GAAAATTATG AAGGTGGACG GTTAGCGCCG 
GAGGCAGCAG TGGCTATTCA TGTTATCCAT CGGATTGGCG CCGTAGTGGT TTTGATAGTG 
CTAAGTGCTC TTGGTATACG GGCAGGGTTA GGCCGAGGCA CTCCCGCGTT ACGCAGCGTC 
GGGTGGATAG TTGTTATGTT AGTCCTTATC CAGGCAGCGC TAGGCATTGC CACCGCTATG 
GGAGGAATTC CATTAGCGCT GGCGGTAGCG CATAACGCTG TAGCTGCATT ATTGTTACTT 
GCCGTCGTTA CTTTGAATCA TTTGCTCCAT CCTACAGGGT ATCCATTACA AGGAGCTACA 
AGACTATGA

Protein sequence

MSRRFYVFAL AASLLALVVV VVGAYVRLSD AGLSCPDWPG CYQKLLAPTT EQQVDHANRL 
YPDRPVETAK AWKEMIHRYL AGILGLLILG LAIAAWRNRS DPTQKVALPL FLLGLVGLQA 
ALGMWTVTLL VQPAIVTLHL LGGMAVLALV WWLALRQRQA RRPMEKIWYS PAFKLLALIG 
LFLLVLQIIL GGWTSTNYAG FYCSDFPTCQ GQWWPTMDFR EAFTFWQPLG ENYEGGRLAP 
EAAVAIHVIH RIGAVVVLIV LSALGIRAGL GRGTPALRSV GWIVVMLVLI QAALGIATAM 
GGIPLALAVA HNAVAALLLL AVVTLNHLLH PTGYPLQGAT RL