Gene Pars_1861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1861
Symbol
ID	5055996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1664300
End bp	1665346
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	54%
IMG OID	640469407
Product	peptidase M48, Ste24p
Protein accession	YP_001154064
Protein GI	145592062
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0501] Zn-dependent protease with chaperone function
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCCGG TGTTCTTAGA CCCTGTGGCA ATGGGCTTGT ACATCTTAGG ATACATCATC 
ATGCTAGCAG TGGCGGCTAC TGTGGCGCCC AAAGTAGCTA GTTCCGTGTC TGGGCGCTTC 
ACGCTCTACG GCGCTATGGC GTTGACAGCT GTCCTAATCG TGTTGACGAC AGCCTTTGTT 
ATCTACCTAA TAGCCGTGGT AGCGGCCCCG TCGGTGGCGG GGTATGGGTG GGGGTTCTTC 
GCAGGGCTTA TCTTCTTCGT CGTTTTTATG AATCTGCTTA CCTACCTCGC GTCGCCGTTT 
TTAATAAATG CATCATATGG CGCCAGGCCA GACCCCCGTC TGCAACAGAT AGTGGACGAG 
GTGGCAGCCA GGCTGGGTGC GCCGTTCAAA ATCAAGGCGG TGGTGGTCGA CGGGCCTCCT 
AACGCCTTCG CCTACGGCAA TATGCTCTCA GGTAGATACG TGGCAGTTAC GAGTTCAATG 
CTGGCGATGA CTGAAAGGAG GGAGCTGGAG GCCGTGATAG GGCACGAGAT TGGGCACCAT 
CTGCATAGAG ACAACGCGTT AATGCTACTC TTCGGCGTAC TCCCGTCAAT TCTCTACTAC 
TTGGGCGTCA CTTCCGTACG TATGGCGATG GCGTCTTCCG GCAACAGGAA CAACAGCCCG 
GCGCTTCTGG CCGCAGTGGG CGTGCTCGCC GTAATAGTAT CCTTCCTAGT CCAGCTTCTG 
GTATTGGCGT TCAGCAGACT CAGGGAGTAC TACGCCGATA CAGAGGGTGC AAAGGCCGCC 
GGCAAGGAGG CCATGCAATT CGCGTTGGCT AAGATTCACA AATTCTACTT CTCAAACCCT 
GAGGCCCACG AGGTTGTCAG CAACGACAAG TTCAGGGCTC TGTTTATATA TGCGCTTGTC 
CAAGCAGTGG CTAATCCCTT CGTGTCGGTT ACCAAGAGCG ATGTGGAGCA GATAAAGCGC 
TCGGGCTATT CGGTGTTTCA AGAGATATTC TCGACACATC CGCCCATACC GAAGCGGTTG 
AAATTCCTCG ACGAGCTACC TTATTAA

Protein sequence

MLPVFLDPVA MGLYILGYII MLAVAATVAP KVASSVSGRF TLYGAMALTA VLIVLTTAFV 
IYLIAVVAAP SVAGYGWGFF AGLIFFVVFM NLLTYLASPF LINASYGARP DPRLQQIVDE 
VAARLGAPFK IKAVVVDGPP NAFAYGNMLS GRYVAVTSSM LAMTERRELE AVIGHEIGHH 
LHRDNALMLL FGVLPSILYY LGVTSVRMAM ASSGNRNNSP ALLAAVGVLA VIVSFLVQLL 
VLAFSRLREY YADTEGAKAA GKEAMQFALA KIHKFYFSNP EAHEVVSNDK FRALFIYALV 
QAVANPFVSV TKSDVEQIKR SGYSVFQEIF STHPPIPKRL KFLDELPY