Gene Nmar_1543 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1543
Symbol
ID	5773851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	1404590
End bp	1406185
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	38%
IMG OID	641317195
Product	cytochrome b/b6 domain-containing protein
Protein accession	YP_001582877
Protein GI	161529051
COG category	[C] Energy production and conversion
COG ID	[COG1290] Cytochrome b subunit of the bc complex
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.000370205
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCCGTTT CGCTTGAGCC AAGAAGAAAT GGTGTAGTTG AATTTCTCTA TTGGTTATGG 
GAAGGTGTAG ATAGAACTAT CTTTACTGCA ATCAAGTTTT CATTTCCTGC AAGATTTGTA 
AGTCCATTTG GATTTTTGGG AATGTTAACA TTCATTGTGT TTATCATTCT AGGAATTTCA 
GGAGCTCTGC TCATGTTTTA CTATCAACCG ATATTGGATA GAGCATGGGA TAGTGTTCAA 
TTCATTAACG ATGAAGTTCC ATTTGGATTC CACATTAGAA ACATACACTA TCATGGTTCT 
AATGCAATGG TTCTCTTAGC TGTTCTTCAC ATGTATTATC AATACTTTAG TGGAAGATAC 
AAAATTAGAA ATGAAGTTTT ATGGATGACT GGTGTTATCT TAGGCGTTGT TACTATCTTA 
GAAGCATTTA CTGGATATGA TGTTATATTC TCTGAAAGAG CGCAACTTGC AATTAGTATT 
GCAGCGTCGT TAACCACTTC AATTCCAGTG GCCGGATCTG TCATACGTGA CGCGGCGTTG 
GGTAGTGGGT TCTCGGACTT TGTATTGAGA TTCTATGCTC AACATGTGTT CTTGTTGCCA 
ATAGTTATGC TTGGATTGAT GGCAGTTCAC TTCCCAAGAT TCTTGGTATT TGATGTACCA 
ATGGTTATGG CAATTGCTGG TGCAATTTTG ATTACTGGTG GTGTTTTCCC AATTGATTTG 
GGATTCAAGT TTGAGCCGAC CGTACCGCCT GGTGTAACCG TACCTGAATG GTATTTGACT 
GGAATTTATG CATTCATGAG AACTCAGTAT GATAAGTTTG TAACAGGGTT GCTGTGGCCT 
TTGATATTCA TTATATCGTT TGTATTGATT CCATTTATTG ATAGATACAA GAAATTCTCT 
TGGAGAGATA GACCAATTAT TACTGCATTT GGAATTACCA GCCTTGCACA GATTATGGTA 
ACAACTTATT GGGGATTCTA TATCTCACCT GACATCTCAA TTCCATTAGT TGAGCGTTTG 
GTAATTGATC CTGTGTTCTT TTACAGTGTG ATGATATTGT TAGTTCCTAT GAGTTTTGGA 
TTTACATACA TGATGATCAA ACTTGCAAAT GAAGCAGAGA GAAAATCAAA ACTAGCAAAA 
AATACTGGTC CGCAGAAAGT TGCAACCTTA GATCTATCTG AAAAATGGAT TAACTGGTTA 
CTTGTTGCAT TACTAGCATT CCAAGTATTC CTTAACATTG CAGCATACAA TGCAGCTTTG 
ACTGGCATGA ACAACATGTC TTTGTTCTTT GTTGGATTGA TACTGATGGT ATTTGCTGGT 
TTCTTCCATA TCTACAGATA TGGTATGAGT CAGCAAAAGA ATGCTCCTCC AGCTCCTCCA 
GCTCCTGTAT CTGATGAGAA ACCAAAACTA GCTGAACCAG AAGAATCTTC ACAACCCGAA 
GAATCTGCAA AACTTCCTGA AGGTGAAACT GCAGCAGAAA AACCTGAAGA GAAACCTATT 
GCTCCAGAAG TTTCTGCACC AAAAACTCAA GCTGACTTGG GAGTTGGTGC AGACAATAAT 
CCAAATCTTG GTACCGGTGA TCTCAACAAA CCATGA

Protein sequence

MAVSLEPRRN GVVEFLYWLW EGVDRTIFTA IKFSFPARFV SPFGFLGMLT FIVFIILGIS 
GALLMFYYQP ILDRAWDSVQ FINDEVPFGF HIRNIHYHGS NAMVLLAVLH MYYQYFSGRY 
KIRNEVLWMT GVILGVVTIL EAFTGYDVIF SERAQLAISI AASLTTSIPV AGSVIRDAAL 
GSGFSDFVLR FYAQHVFLLP IVMLGLMAVH FPRFLVFDVP MVMAIAGAIL ITGGVFPIDL 
GFKFEPTVPP GVTVPEWYLT GIYAFMRTQY DKFVTGLLWP LIFIISFVLI PFIDRYKKFS 
WRDRPIITAF GITSLAQIMV TTYWGFYISP DISIPLVERL VIDPVFFYSV MILLVPMSFG 
FTYMMIKLAN EAERKSKLAK NTGPQKVATL DLSEKWINWL LVALLAFQVF LNIAAYNAAL 
TGMNNMSLFF VGLILMVFAG FFHIYRYGMS QQKNAPPAPP APVSDEKPKL AEPEESSQPE 
ESAKLPEGET AAEKPEEKPI APEVSAPKTQ ADLGVGADNN PNLGTGDLNK P