Gene Pars_0375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0375
Symbol
ID	5055058
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	323340
End bp	324626
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	59%
IMG OID	640467944
Product	hypothetical protein
Protein accession	YP_001152631
Protein GI	145590629
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1232] Protoporphyrinogen oxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.427757
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAGTAG TAGTATTAGG TTGCGGCTGG TCTGGCGTCG TGGCGGCGCA TAGTCTCAAG 
TCCAAATATC CCTCGGCGGG CGTCGTCTGT CTCGACAGGT CTTTTGACGG TGGTCTTCTG 
CGGACCGAGG CGGTCGGCGG CTACCTATTC GACGTTGGGG GTTCTCACGT GCTCTTCAGC 
CGGGACCCGG CTGTCGTTAA CGCCATAACG GCTATGGGCG GCCGTTGGGT TGCTAAGGAG 
AGGAGGGCCT TTGTGTTGTT AGACGGCGTC TTCATCCCGT ACCCCTTCGA GAACGGGATA 
TACGTCTTGC CGCCCGAGAG GAGGGCTAGG TACGGGCTTT CGCTGATAAG GGCGCTTATG 
CAAGGCGATA GGAGACCGGA GAGCTTCAAG GAGTGGATAC TCAACACCTT TGGCGAGGAG 
GTGGCCAAGG ACTACCTAAT CCCCTACAAC GAGAAGATCT GGAAGAGGCC GTTGGAGGAG 
CTTTCGGCCG ACTGGGTATA CACGCCGGGC CGCCTCCCCC TACCCTCCCT CGAGGACATA 
GTGAAGGCCG TGGCGGGGCT GGAGACAGTG GGCTATAGGG AGCAAGCGGT CTTCCGCTAC 
CCCGAGGGGG GTATAATCGC GCAGTACCGG TCGGCGCTTA GAAAAGCCGA GGAGGCCGGC 
GTCTTGCTCG TCAAGGAGGA AGTCAAGGAG GTGAAAAAGA GGACCGACGG CTTTTTGATA 
AATGGAAGAC TCAGAGCGGA TCATATCGTC TCCACGCTTC CGCTCCGCGA TCTTCCGGCG 
ATGCTGGACC CGCCTCCTCC CGAGGAGGTG TTTAAAGCGG CCGGGAGGCT GGACTACAAC 
TCAGTGGCGG TGGTGGGGCT GGGGCTTAGG GCTAAGGCCC CGCCGCAGCA CTGGGTCTAC 
GTGCCGGATA GGCGCGTCGT CTTCCACCGC TACGCCTGGA TATCCAACTA CCTCCCGGAG 
CCTCCCGAGG ATAGGTCGGC TCTTATCGCG GAGATAACAA TACCGCCAAG CCGCGAGGTG 
GATACGGAGG CTCTGGCGGC CGAGGCTGTG AGGGGGCTTT CAGAACTGGG CATTGTGAGG 
GAGAAAGACG TGGAGGTCGT CAAGGTTTGG CTTCACAAAT ACGGCTATCC CATATACACG 
AGGACCCACC GGCAGGACCG AGAAGCCGTG GAGAGGTACC TAGCCGAGGT CGGCATAGCC 
ACCTTCGGCA GATGGGGAAA CTGGCACTAC TGGAACACCG ACGCGATATA CAAGAGGGCT 
ATGGAAATTC GTAACTTAGT GTCTTAA

Protein sequence

MKVVVLGCGW SGVVAAHSLK SKYPSAGVVC LDRSFDGGLL RTEAVGGYLF DVGGSHVLFS 
RDPAVVNAIT AMGGRWVAKE RRAFVLLDGV FIPYPFENGI YVLPPERRAR YGLSLIRALM 
QGDRRPESFK EWILNTFGEE VAKDYLIPYN EKIWKRPLEE LSADWVYTPG RLPLPSLEDI 
VKAVAGLETV GYREQAVFRY PEGGIIAQYR SALRKAEEAG VLLVKEEVKE VKKRTDGFLI 
NGRLRADHIV STLPLRDLPA MLDPPPPEEV FKAAGRLDYN SVAVVGLGLR AKAPPQHWVY 
VPDRRVVFHR YAWISNYLPE PPEDRSALIA EITIPPSREV DTEALAAEAV RGLSELGIVR 
EKDVEVVKVW LHKYGYPIYT RTHRQDREAV ERYLAEVGIA TFGRWGNWHY WNTDAIYKRA 
MEIRNLVS