Gene Pcal_0233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pcal_0233
Symbol
ID	4909383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum calidifontis JCM 11548
Kingdom	Archaea
Replicon accession	NC_009073
Strand	-
Start bp	232172
End bp	233314
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	60%
IMG OID	640123985
Product	hypothetical protein
Protein accession	YP_001055136
Protein GI	126458858
COG category	[R] General function prediction only
COG ID	[COG1373] Predicted ATPase (AAA+ superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.230022
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGTGGT GGCCCGAGCT CATTGACGAA ATCTCGCTGA AGCCCCCCGC GCTCCACTTC 
CTCTTCGGCC CTCGGCAGGT GGGCAAGACG ACTCTGCTAA AGTTGCTCGT GAAAAAGCTC 
GTGGAGGGCG GGAGAGATCC CCGTACTATT TTCTACTACA CCTGCGAAAT GGCGGCTGAC 
CACAGAGAGC TGGGGGAGGT CCTCGGCGAG ATTGTAAAAC TTAAGAAGAG GTGGGGCGTC 
TCAAGCGCCT TGGTGCTCCT GGACGAGGTG ACTTACCCCA GGGAGTGGTA CAGGGCCCTC 
AAGTTCTACC TCGACCAGGG GCACTTTCAA AACGACGTGA TAATTGCCAC AGGCTCGGTG 
AGCATGTACG CCAAGAGGGA GGTGGAGACT TTCCCAGGCC GGAGGGGGTG GGGGCGGGAC 
TACGTCATGT ACCCGCTCTC TTTTAAAAAA TTCGCCGAGG TGCAAGGCGT GCCGCCTGGG 
GCAGACCCCA CGGCGTGGAG GACGGAGCTC GCCGAGGCGC TTGAGCTCTA CCTCAAATGC 
GGCGGCTACC CCGCCGCCGT GGTAAACTGC GCCACCTCAG GCAACCCCGG GGGCGCCGCC 
GACGTGGTGA TCTCCTCCCT CGCCTTCGAC TTGGCGAGGC TTAAGAGGAG CGAGGCGTAC 
GCGAAGCGCC TCCTCAAGGC GGTCTTAGAG ACGGCCCCTA GCCCCGTCTC TCTCAACGCC 
TTGGCCAAGG AGGCAGAGCT CCGGTCGCAC AAGATAGCCT TCTCGTACCT CAACCTATTG 
GAGTCCCTCT ACCTCCTGCG CCAGCTCTAC TACATTGACC CCTACCGCTT GGTCGAGGAC 
TACAAGAAGC CTAGGAAAAT CCACCTATTA GACCCACTGG TCTACCAAGC CGCCGCCAAG 
TGGACCGGGG CGAAGATTCC GCACGAGGCC GCGCTCTTAG AGGCAACCGT GGCCATGCAC 
TTCGCCAGAA GCCACAGAGT GGGCTACTGG CGAGACGGCT TTGAAGTAGA CGTGGTAGTG 
CCAGAGCTAG GCCTCGGGAT AGAGGTTAAG TGGGGCAAAA AGGCCGGGAT GAAGAGAGTG 
GGGCAAATCG TGGCGAAGAC CCTAGACCTA GAGGAGCTGG CCCAGCTCCT TTATCAGCTC 
TAA

Protein sequence

MKWWPELIDE ISLKPPALHF LFGPRQVGKT TLLKLLVKKL VEGGRDPRTI FYYTCEMAAD 
HRELGEVLGE IVKLKKRWGV SSALVLLDEV TYPREWYRAL KFYLDQGHFQ NDVIIATGSV 
SMYAKREVET FPGRRGWGRD YVMYPLSFKK FAEVQGVPPG ADPTAWRTEL AEALELYLKC 
GGYPAAVVNC ATSGNPGGAA DVVISSLAFD LARLKRSEAY AKRLLKAVLE TAPSPVSLNA 
LAKEAELRSH KIAFSYLNLL ESLYLLRQLY YIDPYRLVED YKKPRKIHLL DPLVYQAAAK 
WTGAKIPHEA ALLEATVAMH FARSHRVGYW RDGFEVDVVV PELGLGIEVK WGKKAGMKRV 
GQIVAKTLDL EELAQLLYQL