Gene Nmul_A2666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2666
Symbol
ID	3785673
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	3058964
End bp	3060451
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	55%
IMG OID	637812756
Product	cytochrome c oxidase, subunit I
Protein accession	YP_413345
Protein GI	82703779
COG category	[C] Energy production and conversion
COG ID	[COG0843] Heme/copper-type cytochrome/quinol oxidases, subunit 1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000219403
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACTT ATACTTATAC CCCGGTTCCC GATCAGGGAG CCAAGGCGGG CGTGCTGGCC 
TATCTGGTCA TCTCCTGTGT AGTATTGCTA CTGATGATGC TTTTCGGCCT GCTCATGAGG 
ATGGAGCAGG CGCAAATGAT CTCCATCGGA GCACTCTGGT TTTATAAAAT CATGACGTTG 
CACGGTGCCG GAATGGTGGG TATCGTCGCC CTGGCCGGAG CGGCCATAAT GTGGCATTTT 
CTGCGCCAGT ATGTCGATCT GTCGACAGGT ATATTCATGG CCAACCTGAT CCTGTTTCTG 
ACAGGGGTCG TCATGATCCT GGCGAGTGTC CTGCTTGGCG ATTTCCACGC CGCCTGGACC 
TTCCTCTTTC CGTTGCCCAC CACTTCCATG GGCATGTGGA GTCCGGGAGC TGCCGCGCTG 
TTCATGGGCG GATTGCTGGT CATCGGCGTC GGTTTCGTGC TGCTGCATCT GGATATCGCG 
CGCGCCATCA TCAGCCGCTA CGGCGGTCTG GGTCGCGGAC TTGGCTGGCC ACAGCTTTTC 
GGTCCTGATG ACGGCAACGC ACCGCCGCCG GCCGTGGTTG CCAGCACCAT GGTCACCATC 
GTCAACCTGA TTGGCCTAGT GGTCGGCGCC AGCATCCTGG TTATGATGCT GATCAATGTT 
TACGTCCCGA CTTTCGAAAT CGATCCGCTG CTGGCCAAGG GCATGATCTA CTTCTTCGGA 
CACGTATTCA TCAATGCCGT TATCTACATG GCTGTGATCG CGGTCTATGA AATCCTGCCG 
CGCTATACGC AACGTCCCTG GAAGGCGAAC AAGGTGTTTC TTGCCTCCTG GACCGCTTCC 
ACGATCATGG TCATGTTCAT CTTCCCGCAC CACCTGTTGA TGGATTATGC CTATCCCAAG 
TGGTTCCTGA TCATGGGTCA CATCATCGGT TATCTCAATA CCTTCCCGAT CCTGATCGTG 
ACGGGTTATG GCGCCATGAT GATCGTGTAC CGGTCGGGTA TTCGCTGGGA TATGTGCTCA 
CGGCTGCTGT TCGTGTCGCT CTTCGGTTGG GCAGTCGGCG CGATGCCCGC GTTCATCGAC 
GGCACCATCA CGGTCAACTA TGTCATGCAC AACACGTTGT GGGTGCCGGG ACATTTCCAT 
ACCTATCTGT TGCTCGGCAT GGTTGCGATG GTCTTCGGGT TCATGTATTA CCTTGGCAAG 
CCGAACGAGA ATGCGCCGGA TAGCGCCCTT GACGTCGCTG CTTTCTGGGG ATTCGTTATC 
GGCACCATGG GTTTCACCAT GAGCTTTCTC TATTCCGGGA AAATCAGCGC CGCGCGCCGC 
TATGCGGAAC ATCTTCCGGA ATGGGTGCCT TACGACAAAA TTGCTTCATA TTTCGCAATG 
TTGTTGATCG CTTCTGTGCT AGTATTCATT TTCCGCTTTC TTACGCGGTT GGGGCTGGCG 
AGTCGCGATT ATCAACGCGC CTCTCTTGCG CGAAGTATGG CTACATGA

Protein sequence

MATYTYTPVP DQGAKAGVLA YLVISCVVLL LMMLFGLLMR MEQAQMISIG ALWFYKIMTL 
HGAGMVGIVA LAGAAIMWHF LRQYVDLSTG IFMANLILFL TGVVMILASV LLGDFHAAWT 
FLFPLPTTSM GMWSPGAAAL FMGGLLVIGV GFVLLHLDIA RAIISRYGGL GRGLGWPQLF 
GPDDGNAPPP AVVASTMVTI VNLIGLVVGA SILVMMLINV YVPTFEIDPL LAKGMIYFFG 
HVFINAVIYM AVIAVYEILP RYTQRPWKAN KVFLASWTAS TIMVMFIFPH HLLMDYAYPK 
WFLIMGHIIG YLNTFPILIV TGYGAMMIVY RSGIRWDMCS RLLFVSLFGW AVGAMPAFID 
GTITVNYVMH NTLWVPGHFH TYLLLGMVAM VFGFMYYLGK PNENAPDSAL DVAAFWGFVI 
GTMGFTMSFL YSGKISAARR YAEHLPEWVP YDKIASYFAM LLIASVLVFI FRFLTRLGLA 
SRDYQRASLA RSMAT