Gene Pars_0436 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0436
Symbol
ID	5055237
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	378118
End bp	379098
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	52%
IMG OID	640468001
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001152687
Protein GI	145590685
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGATTG CTGTGCTTTC GTCTAGGGAG GTGCCGAGGG GTAGGCCTAT TGGTGTGAGG 
AGGTTGGGTA TGGACTTGGT GTTTTGGCGT GACGATTCGG GGAGGATCCA TGCCTTGCTT 
GACGACTGTC CACATAGGCG TGCGAGACTT TCACTCGGCA AGGTGGTGGG TGGGAAAATC 
CAATGTCCGT ATCACGGTTT TGAGTTCGAC GGGTCTGGCA AGGTTATTAA AATACCGGCT 
TTGGGGAGGT CGGCTAAGTT GCCCGAGTAT TTGAAGGCCT TTTCTATGCC GGTGTACGAT 
GCCTATGATA TTGTTTGGGT TTGGTATGGC GGCGGCGAGC CAAGGGGGGC GCCGAGGTTT 
TTTGAAGACT TGGAGGGGTT GGAGGCGTAC TCGGAGTACA GCGAGGTGTG GGGCGTCTCT 
TTGCCGAGAG CTGTTGAGAA TCAGCTCGAC GTGTTCCACC TGCCCTTTGT GCACTATAAC 
ACCATTGGGA GGGGCGGGAG GACGTTGGTG CACGGCCCGT TAGTGAAGCC GGTTGATGAC 
TACTCTTTCG TAGTTTACCC ATTTAACCAG GTGGATAGGG GTCAAAGACC GCTGAGAAGT 
AGCGAGATTG ATGTGGGGAA GTTGAGGAAC TACTTGTGGT TCATATACCC AAACCTGTGG 
GAAAACTACA TATCGAAGAA TATGAGGGTT GTGGCCTTCT TCGCGCCTGT GGGCTCAGTC 
TCCACTAAGA TTTACCTAAG GCTCTACATG AAGGTTACCG GAGTGAAACC GCTGGATGCG 
TTGATTGCAA AGTTGCTAAT GCCTTTCAAC GTCTATGTGC TCCACCAAGA CCGTAGAGTA 
GTCACTTCGC AGGCCGGGGA TATTATGCGC GACAAGCTAA TCCACGCAGA CGCCCCAATA 
GCGATGTACA GGAGGATGTA CCTCAGCGAC AAGGAGCTAA ACAAGCTCCT TGAAAAGAAG 
AGCTGGGGGA AAGGGTCGTA A

Protein sequence

MRIAVLSSRE VPRGRPIGVR RLGMDLVFWR DDSGRIHALL DDCPHRRARL SLGKVVGGKI 
QCPYHGFEFD GSGKVIKIPA LGRSAKLPEY LKAFSMPVYD AYDIVWVWYG GGEPRGAPRF 
FEDLEGLEAY SEYSEVWGVS LPRAVENQLD VFHLPFVHYN TIGRGGRTLV HGPLVKPVDD 
YSFVVYPFNQ VDRGQRPLRS SEIDVGKLRN YLWFIYPNLW ENYISKNMRV VAFFAPVGSV 
STKIYLRLYM KVTGVKPLDA LIAKLLMPFN VYVLHQDRRV VTSQAGDIMR DKLIHADAPI 
AMYRRMYLSD KELNKLLEKK SWGKGS