Gene Pars_1395 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1395
Symbol
ID	5055958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1258452
End bp	1259546
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	61%
IMG OID	640468938
Product	hypothetical protein
Protein accession	YP_001153607
Protein GI	145591605
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1030] Membrane-bound serine protease (ClpP class)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.51965
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.883409
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGTTTC TACTTCTTTT TGCGGCCTTA GCCGCGGCGG TAGCTGGCTA CAACGTATCT 
ACTGTGTACG TCGTCGATGT ACGCGGCGTC GTGGGGCCTC ACACCTACTG GCAGGTGGCT 
AAGGCGGTTG AGGCGGCGGA GAGGGGCGGC GGCGCTGTGT TGTTGCTCTT GTCCACCCCT 
GGTGGGCTGG CGGCGCCTGC TAAGCGCATA ATGGGCCTAG TCCTACATTC AAAGGTCCCG 
GTGCTGGGCT ACGTATATGG CGAAGAGGCG GCGTCTGCGG GGACCTACAT CCTAATGGCT 
ACCCACATTG CCGGGATGGC GCCCCACTCA AAAATAGGCG CTTGCCAGCC GGTGTTGTTG 
GTATTCCTGG TGGAGGATCC TGGGGTTATC GCGCAGCACT TGAGCATCTT GGCGGAGGCG 
ATGAGCAGAA GGGGGCGAAA CGTGGAGTTT GCGGAGAGGT GTGTCCGGTC TAAGGAATAC 
CTAATCGGCG CCGAGGAGGC CCAGAAGATG GGGGTAGTGG AGGTGGTGGC GGGGAACTTC 
GTCGAGTTTG TGAAGAGGGC TAACGGAACC GCGGTGAGCC TCGACGGGGT TGAGGACAAG 
GTGTTTTTCC ACTCTCCAAA ATACGTCCTG GTGGCCCCAG GCCCCGTTGA GCTTTTCCAG 
TCTTGGCATC TGCCCGAGTC GCCCGCCGCC TTGCTTTACT TCTCGACACT CCCCCTTCTG 
CTACACGTTG CGCTGTTCCT CGCCGCGATG TACGCAGTAC TTCTCTACGC CAAGATGAGG 
GGCTGGGCCG CAGTGGCCAA CCTGTCGGCG TTTGTCCTCG CGTTGTATGT CTCCCTTGCA 
ACGTTGCCTC CGCCTTGGCT CTTGGCCTCC GTGGCAGGTG CCGTGGCTAT ACTCGCCGAT 
CTTTTTATAA GTAGGCACAC GCGAGGCTTC GTTGCCTTTG CGGCGGCGTT TGTCCCCCAG 
ACGGCGGTGT CCGCCTTCTA CCAAGAAGGC GCGGCGGCGG TGGCGTGGGC AATTGCCCTG 
ATAATCTCAG CGTCAGCGGC CGGGGCTGTT ATTTACATAT CACGCAGAAA GAGGCCCCAG 
GTGCCCTCCT GGTAG

Protein sequence

MRFLLLFAAL AAAVAGYNVS TVYVVDVRGV VGPHTYWQVA KAVEAAERGG GAVLLLLSTP 
GGLAAPAKRI MGLVLHSKVP VLGYVYGEEA ASAGTYILMA THIAGMAPHS KIGACQPVLL 
VFLVEDPGVI AQHLSILAEA MSRRGRNVEF AERCVRSKEY LIGAEEAQKM GVVEVVAGNF 
VEFVKRANGT AVSLDGVEDK VFFHSPKYVL VAPGPVELFQ SWHLPESPAA LLYFSTLPLL 
LHVALFLAAM YAVLLYAKMR GWAAVANLSA FVLALYVSLA TLPPPWLLAS VAGAVAILAD 
LFISRHTRGF VAFAAAFVPQ TAVSAFYQEG AAAVAWAIAL IISASAAGAV IYISRRKRPQ 
VPSW