Gene Pars_0542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0542
Symbol
ID	5056369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	486603
End bp	487739
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	51%
IMG OID	640468104
Product	methane/phenol/toluene hydroxylase
Protein accession	YP_001152789
Protein GI	145590787
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0947319
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.353657
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTATTTA GAGCTATGAG CTGGGACGAG GTGTATAAAA GGATATTCGC CAAGGCGTCG 
ATGACCGAGA AGTTCTTTAG AGATAGGGAA TACGCCGGCT ATAAGAGAAC TTGGATTACC 
TGGCCGATGT TGGAGAGGAA AATCGGGAGG AGGAGGCCGT CTGAGTATCA AGTCGTCTCC 
TACGCGCTGT CTTACTGGTC TCCCGATCCA AACTCGCCCA CATACCGCTA CCTCGGAGCG 
CCCTTTGAGC TAAGCCCCAC TCACCACATC CAGAAGTGGT ATATATACTT CAGAGATAAA 
TCGCCGTTAG TCAAGGCGGT CGTCGAGGCG GGAGGGTGGC ATGACTACAG CGATCCGCAC 
GAAATTGTGT ATTGGAAGTA TAATGCTATG ATGGACGAAG AGGAGACCGT TGTGGACGGG 
CTGTTGGAAC AGATAGTTAA GACTAAACAC GACACGATGC TGTCAGAGGA CATGCTTAAA 
TTCTACAGGG ATTACTACGA CCCGCTGAGG TTTATTTGGC ACGCCCTTCA GATGCACTGC 
GCATATCTGG GCCAGATGGC CCCCACCAGC ACTGTGATTA ACATATTCAC CTTCATGGCC 
ATGGACTACC TCAGGAGGGC GCAGAGAGTG GCGCAGAGGA TAAAGATGTT AGACATCGTC 
TACCCTGGAT ACGGCTTCGG CGCCTATGGG AGGCAGAAAT GGGAGGAGGA TCCCGCCTAT 
CAGCCCCTTA GGCAAGCCGT GGAACAGATG TTAGTGGCAT ACGACTACAC AGAGGCGTTG 
GTCTCATTCG CCCTAGCTAT AAAGCCGGCT GCCGACATTG CCCTTTTAGA ATATTACGGC 
AGACTCGCAG ATCTCAACGG CGATAAATAC CTCTACCAGA TACATCTATC CTTCTTAAAG 
GACTCCCAGA GGCATCAAGA TCAGCTGGTC GCCCTCTTTA AATACGCCTT TGAGAGGGCG 
CCTTCAACAA AAGACATAGT GAGATCTCAA TTAGGGCGTT GGAGAAATGC CGCGGAGGCC 
TCCGTGCGGG GGCTAAGGCC TGTTTTTGAG TCTATGCCAG TGAAAATACC AGTGGACGAG 
GTAGTAGATA GCGTAAAGGC GAAATTCCGC GAGCTAGATT CGGCGATAGG GCTATGA

Protein sequence

MVFRAMSWDE VYKRIFAKAS MTEKFFRDRE YAGYKRTWIT WPMLERKIGR RRPSEYQVVS 
YALSYWSPDP NSPTYRYLGA PFELSPTHHI QKWYIYFRDK SPLVKAVVEA GGWHDYSDPH 
EIVYWKYNAM MDEEETVVDG LLEQIVKTKH DTMLSEDMLK FYRDYYDPLR FIWHALQMHC 
AYLGQMAPTS TVINIFTFMA MDYLRRAQRV AQRIKMLDIV YPGYGFGAYG RQKWEEDPAY 
QPLRQAVEQM LVAYDYTEAL VSFALAIKPA ADIALLEYYG RLADLNGDKY LYQIHLSFLK 
DSQRHQDQLV ALFKYAFERA PSTKDIVRSQ LGRWRNAAEA SVRGLRPVFE SMPVKIPVDE 
VVDSVKAKFR ELDSAIGL