Gene Pars_0014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0014
Symbol
ID	5055744
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	9814
End bp	11097
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	50%
IMG OID	640467594
Product	hypothetical protein
Protein accession	YP_001152283
Protein GI	145590281
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1030] Membrane-bound serine protease (ClpP class)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAATAG CGATTCTACT GTTGTTAGTA GCCTTTTCCT ATGCCTATGT GGCTACGTCA 
GTTTATGTAG TTGAAATTAA CGGGGTTGTA GGCCCCTATA CCTACTCGCA GATACAGCGA 
GCTATATCCC TCGCTGAGCA GAACAACGGG CTTGTGCTCA TATTGTTATC AACTCCTGGA 
GGCTTGGCAG ACCCCACTCT CCAGATAATA AGGGAGATTG GCAACTCCCC CGTGCCTGTT 
GTGGGATATG TCTACCCGGA CTACAGCTAT GCCTGGTCTG CGGGGACTTA TATACTGCTA 
TCGACCCACA TCGCCGCCAT GGCGCCGCAT ACTGTAATAG GCTCTTGTCA GCCGATATCT 
GGTGGAACCC CGGTAAATGA GTCTAAGATT CTAAACGCAT TGATAGGATA TCTCGAAACT 
GTGTCTAAGT CGTATGGCAG GAACGGTACT TTTGCCCGTC TCTGTATTAC CCAGAATATT 
AACCTAGACG CCGAGACGGC GTTGAAATAT AGGGTAATAG ACGTGGTGGC CACCGGTGTA 
GATGACCTTT TGAAGAAGAT AAACGGCATG ACGGTGTTGT TGCGAAACCA GCAAACAGAG 
CTAGTGGTAG AGAGCCCGGT GATAAGGCGT GTCGAACCTT CACTTACTGA AACTTTACAG 
ATGTGGCTAA GCGACCCAGT GATGTCCAGC GTCTTGTCTC TCTTGGCGTT TTTGTTACTG 
CTTGCGGCGT TTATCACAGG CCACCCCGCC GCCGCGGTGG CGGCCATAGT ATTGCTGGTT 
ATATCTATGT TCTCGATTTT GCCAACGGCG TGGTTGGGCC TCGCGCTTAT AATTATGGGC 
GCCGTGTTGA TACTGGCAGA GATATTAATG GGCATGGCGG CACACGGCGC CGTGGCCGGC 
GTAGGCGCCG TCCTGCTAGT AGTGGGATTC TTATCCGCCT ATCCTGCTAA CGTTTTCAGT 
GGAGAGCTTA TCCACATCAG GGATTGGTGG CTCATCCAGC TTGGCCTATA TGTAAACATA 
GCAATACTTC TAGGATTTCT CGTCTTTGTC GTGTACAAGG CAGTTATTAT CCATAAACAG 
AGGCCGCCCT CTGAAATTTT GACAACTCTC AAGGGGGCAG AGGGGGTGGC AGTGGACGAT 
ATAGGGCCTG GATCTCCCGG CTTTGTGATA GTCTTCGGAG AATACTGGAG GGCTGTTTCT 
GATACACCGG TAAAGAAGGG TTGCAGAATA CGTGTGGTGG AGATTGCTGG GGAGATCTTG 
AAAATAGAGC CGGTTCAGTG TTAG

Protein sequence

MRIAILLLLV AFSYAYVATS VYVVEINGVV GPYTYSQIQR AISLAEQNNG LVLILLSTPG 
GLADPTLQII REIGNSPVPV VGYVYPDYSY AWSAGTYILL STHIAAMAPH TVIGSCQPIS 
GGTPVNESKI LNALIGYLET VSKSYGRNGT FARLCITQNI NLDAETALKY RVIDVVATGV 
DDLLKKINGM TVLLRNQQTE LVVESPVIRR VEPSLTETLQ MWLSDPVMSS VLSLLAFLLL 
LAAFITGHPA AAVAAIVLLV ISMFSILPTA WLGLALIIMG AVLILAEILM GMAAHGAVAG 
VGAVLLVVGF LSAYPANVFS GELIHIRDWW LIQLGLYVNI AILLGFLVFV VYKAVIIHKQ 
RPPSEILTTL KGAEGVAVDD IGPGSPGFVI VFGEYWRAVS DTPVKKGCRI RVVEIAGEIL 
KIEPVQC