Gene Nmar_1678 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1678
Symbol
ID	5774298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	1537367
End bp	1538377
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	34%
IMG OID	641317332
Product	blue (type1) copper domain-containing protein
Protein accession	YP_001583012
Protein GI	161529186
COG category	[C] Energy production and conversion
COG ID	[COG3794] Plastocyanin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAAAA AATTTTTCAT TTTGTTTGTT GTTGCAACAA GTTTTCTATT TACAGGAAAC 
ATACAAAATT CCTTTGCTGA GGATTTTGTT GTAAGTATTC CTTTTGGTGC ATTTAATCCT 
GAACTAAATA CCCCTGCTAA AGTTTGGTAT GATCCACCTG AATTATCTAT TGTTGAAGGG 
GATACTGTAA CATGGGTAAA TGATGATAGA GAAGGGCATA CAGTTACCAG TGGCAGTGGT 
GCAGGAAGAT TTGATTGGAT GGATGCCAAG AATCTTGGTG AGCCTGATGG ACTGTTTGAT 
AGTTTAAGAT TTATGCCAGA CGAGTCTTGG TCATATACAT TTGAAAAAGC TGGAGATTAC 
AATTACTTTT GTGTAATTCA TCCCTGGATG GAAGGAATTA TTTTTGTGAA ACCATTTATT 
CCTGATTATC CCCATGATGC TACAGGAAAA AAGTATGAAC AGTTCCCTAC ATTTCTTATA 
ACTCCTGATG GTTCAATTGA AATTAATTTT TCATGGGAAC CTCGAGTCAT TAAAACCCAT 
GAAAAAACAA ACTTCATCTA TCGTTTTTAT GATGCAATAT ATGATCAGCC ATTAAGAAAG 
TTAGAATATG ATATAGCTAT TTTACAAAAT AATCAAGTGT TATACAAAGA TGAAGGCGCA 
GTATCAGGTG CGGGTGGGGA TTACCGACAA TGGATATTTG AAGAACCAGG CCCTATCATT 
GTTAAAATAT CAAATATCAA ACCTTATGGT TCTGTAGCAG AAACACAAAT CAATCTTGGA 
CCTGATGCCA CTGCTAGATT AGGAGATTTT ACAGCTATGG TTTATGAAAA TTATGAAAAG 
AAAACTACTA CTGAAAAAAT TGTACAACCT CGAGATACTT TGCAATTTTA TTATGAGATT 
GCCGTAGCAA TGATTATAGT TCCTGCAATT ATGTTGGCAG TTATAGTGCT ATATATGAAA 
GGAAAAAAAC CTACTTATAA TTATCCTGAA AGAAAAGCGA GTCCTGTGTA A

Protein sequence

MQKKFFILFV VATSFLFTGN IQNSFAEDFV VSIPFGAFNP ELNTPAKVWY DPPELSIVEG 
DTVTWVNDDR EGHTVTSGSG AGRFDWMDAK NLGEPDGLFD SLRFMPDESW SYTFEKAGDY 
NYFCVIHPWM EGIIFVKPFI PDYPHDATGK KYEQFPTFLI TPDGSIEINF SWEPRVIKTH 
EKTNFIYRFY DAIYDQPLRK LEYDIAILQN NQVLYKDEGA VSGAGGDYRQ WIFEEPGPII 
VKISNIKPYG SVAETQINLG PDATARLGDF TAMVYENYEK KTTTEKIVQP RDTLQFYYEI 
AVAMIIVPAI MLAVIVLYMK GKKPTYNYPE RKASPV