Gene Pars_1643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1643
Symbol
ID	5054588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1482688
End bp	1483701
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	62%
IMG OID	640469186
Product	peptidase M48, Ste24p
Protein accession	YP_001153848
Protein GI	145591846
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0501] Zn-dependent protease with chaperone function
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.691275
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGGTGG GGGAGGTACT GCTGGTATAT ATAGCGGTTC TGGGGGCGTC TATATACCTA 
GCACCGCGAG TCGTAGGGAC TAGGCGGTGG AAGCTCGGCT TCTACGGGCT AATGGCGCTG 
GCCGTTGCCG GAATAGTCCT CACCGCATAC TACGTCTTGT CTCCCCTCCT CTTACCCATA 
GTCCTGCTGT TCCAAGCCGC CACCGGCATT AAGGACTACG TACTGGCGTT CGTAGCCCTC 
GTGGCCACCT CCGCGTTTAT TATGTACCTG GTAGCGCCGT TCCTCATAAA CGCCGCCTTC 
TCCCCGCGCC CCGACCCCTA CCTACAAGGC GTCGTCGATG AGGTCGCCGC CAGGATAGGC 
AGGCGGGTGA GGGCCAAGGC CGTGGTCGTG GACGGGCCGC CCAACGCCTT CGCCTACGGC 
AACTTCCTCT CCGGCCGATA CGTGGCGGTT ACGACGGGGC TACTGAAAAT CGCAAACCAA 
GACGAGCTGA GGGCCGTGAT AGGCCACGAG CTGGGCCACC ACGCCAACCG CGACAACGAG 
GTCATGTCAG CCCTGGGGAT CCTCCCATCG CTGGCCTACT ACACCGGAGC CGCCGCCATA 
GCCATCGGCC TAGCCAACAG GGAGAGGCCC GGGCTCCTGG CCGTTGCATA CGGCGTCGTT 
ATGATAGTCG TGTCCTTCAT AATCCAGCTC CTGGTCATGG CCTTTAGCAG GCTCCGGGAG 
TACTACGCCG ACATGCACGG CGCCCGCGCC GCGGGGAAAG AGGCGATGAT GTCAGCCCTC 
GCCAAGATAC ACCAGTATTA TAAAAACGCC CCAGAAGAGC TACAAGCCGC GCCCAAGACC 
TCCGGCTTCA AAGCCCTATT CATATACGCC CTCGTCGAGG CCGCCGCCAG CCCATTCGCA 
GACCAGATCC GCCTCCTCAT GAACGAGCGC ACCTCCTGGC TCGAGGAGCT ACTATCCTCC 
CATCCACCCA TACCCAAGAG GCTGAGATTC CTCGCCGCGT TGCCCGCCCT CTAA

Protein sequence

MGVGEVLLVY IAVLGASIYL APRVVGTRRW KLGFYGLMAL AVAGIVLTAY YVLSPLLLPI 
VLLFQAATGI KDYVLAFVAL VATSAFIMYL VAPFLINAAF SPRPDPYLQG VVDEVAARIG 
RRVRAKAVVV DGPPNAFAYG NFLSGRYVAV TTGLLKIANQ DELRAVIGHE LGHHANRDNE 
VMSALGILPS LAYYTGAAAI AIGLANRERP GLLAVAYGVV MIVVSFIIQL LVMAFSRLRE 
YYADMHGARA AGKEAMMSAL AKIHQYYKNA PEELQAAPKT SGFKALFIYA LVEAAASPFA 
DQIRLLMNER TSWLEELLSS HPPIPKRLRF LAALPAL