Gene Pars_0526 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0526
Symbol
ID	5055769
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	474260
End bp	475225
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	61%
IMG OID	640468088
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001152773
Protein GI	145590771
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG2146] Ferredoxin subunits of nitrite reductase and ring-hydroxylating dioxygenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.814974
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCAGA TCCCGAGGGA AAAGATAGAC GAGTTTGAGT TCGCGCTGTA TGAAAGCTGG 
GTGGAGTGGT TCAGGCGGGA ACCTGGCATA AACGGCTATA GGCGGTTCAT AAACCAGAAG 
CTTGTCGAGG AGATGACGGT GATACAGCTG GTGCGGGCCG CCATAGGCAG GCCGGAGCTC 
ATGGGGGACC CCGACATATA CCACAAGATG GGGTGGATTG TGGATTGGCA CGAGAGCTCG 
CTGTATCGCC GCTGGTTCGT GGCCTCCAGG TCGCTGGGGC TCAACGGGTA TAAGCTGGAC 
AAGAAGAGGG CGGAGCTTCT GGACTCCGTG GTGGGGACCG CCAAGGGGGA TATAAAGAGG 
GGGCTCCTCC TCCTGCGGAC TGCCCTTAAA TACGTCCACA CTGGCTACCG AGCGGCGGCG 
TATTGGGCCA ACAACCGGCA CATAGCCCAG CTGGCATACA TGGCGTACAT GAGGGAGGAG 
GACGAGATAA AGGTGGTGGA CGACGCCCTG CAGTTCATGG GAGTGGCCAG ACCCGACAGA 
GCGGGTATGG ACATGCTGGA CTTCAACACC CTAGTGCCCA TCTTCTTCGA CTTCTTCCAG 
CCGCCTGAGG CCGCCGACGA CGGGGGCCCC AAGCTGGAGG CCCCGGAGTG GGAGAGGGTC 
GCCACGGTGG ATGAGCTCAG GCAACTGGGT AAGAAGATGG CCGTGGTGGG GCTGTGGCGG 
GAGGTCCTGC TGGTGCCCGT CGACGGCGGA GTCGCGGCCT ACGAGAACTG GTGCACCCAC 
GAGAGGGACC CCCTGCACTA CGGCTACATC CAGGGGAAGC AACTCATCTG CCTCGGCCAC 
CACGCCACCT TCGACGTCAG AACGGGTAGG GTGATTCTGC ATCCCAACCA CGGCGAAGCC 
AGGGTGTTGC CCAAGTACCA GGTTAAGGTG GAGGGAGGCG TGGTGTACGT CAGGGTGCCA 
TGGTGA

Protein sequence

MSQIPREKID EFEFALYESW VEWFRREPGI NGYRRFINQK LVEEMTVIQL VRAAIGRPEL 
MGDPDIYHKM GWIVDWHESS LYRRWFVASR SLGLNGYKLD KKRAELLDSV VGTAKGDIKR 
GLLLLRTALK YVHTGYRAAA YWANNRHIAQ LAYMAYMREE DEIKVVDDAL QFMGVARPDR 
AGMDMLDFNT LVPIFFDFFQ PPEAADDGGP KLEAPEWERV ATVDELRQLG KKMAVVGLWR 
EVLLVPVDGG VAAYENWCTH ERDPLHYGYI QGKQLICLGH HATFDVRTGR VILHPNHGEA 
RVLPKYQVKV EGGVVYVRVP W