Gene Pars_1130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1130
Symbol
ID	5054657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1025314
End bp	1026768
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	58%
IMG OID	640468686
Product	CRISPR-associated helicase Cas3
Protein accession	YP_001153360
Protein GI	145591358
COG category	[R] General function prediction only
COG ID	[COG1203] Predicted helicases
TIGRFAM ID	[TIGR01587] CRISPR-associated helicase Cas3

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.566475
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.71889
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGAGGG CGATAAGGAA AGCCTTGGAG TTGGCGGAGA GGGGGGTGGA TAAGATAGTG 
TCGGAGTTGC CCACCGGCTA CGGGAAAACC GTCGCCGCGC CGTTGCTTTA CAAGAGGTTT 
AGGGCGGCTG GCCTCTGCTG GAAAGCTATA CACGTCTTCC CGCTGAGGGC TGTGCTACAC 
ACGACCTTAA AGAGGTACGT CACGGAGCAC CCCGATATCC AATTCGCCTA CCAGGACGGC 
GACGTCACGC TGAGAGCTGA CGGCTACGTC AAGGACCCGT GGTTCACCTC AGAGTACGTC 
CTCACGACGT ACGACTCCTT TATCCACAAC TTGCTTAAGG CGCCGGTGGC GGAGTTCCAC 
AAATTGCTAA GCCACGGGAG GGGGGTGCAC TACCACTGGC CGATGGCCGA GGTTTACCCC 
TCGTGCGTTT TTCTCGACGA GGTGCACCTG GCGGTGGAGG GGGCGAAGCA GGTCGCGGCG 
GTTAGCGTGG TGGTGAACAT GCTGAGGGAG ATGGAGGTGC CGACAGTGGT GCTCTCGGCG 
ACAATGGGGA GGTGGAAGCA CGACATCTTT AAAGACTTCG TCTTCGTCCA GCTGGGGGAA 
AAAGACGAGG AGGGCGACCG CCTGGTTGTT GTGAGAGACG AGGAGTTCGA GAAGTCCATG 
GGGGAGGTGG AGTACAGCGT AGATGTGATA GATGAGAACT CGGTGGCGGC CTTGGCGAGG 
AGAAAGGTGA AGGAGGGGAG GCGCGTCCTT GTCGTGTTAA ACAGCCTCAA AAAGGTAGTC 
GCCCTAAAAA ACGAGCTTGG GGATCTCAAC CCGGTTTTGA TACACTCAAT GCTGACGCGG 
AGGGATAGGC AGGCCGCAGA GGAGGAGGTC AAAAAGGCCC AGCTCGTGAT CGGCACCAGC 
GCAATCGAGG CCGGCGTCGA CACGAGCTTC GACGTGTTGA TATCAGATAC TCCCAGCGCC 
GAGTCCGTAG TGCAGAGGGT AGGCAGAGTA TGCCGCTACG GCGGGAGGTG CAAGGGGGAG 
CTCTACTTCT TCGGGGAGGG CGCGGAGGAG CTACGGGAGG TGAAGCACTG GAGGTTGCCG 
TACAAGAAGG GGAGCTACGC CGGGTTGCTC AGAGAGCAGA TCGAGAAGGA CCGCAGACTG 
ACGTGGCTCT ACGAGATGTT GGCAAGGGCC TTGTGGATAG AGGATATCAA TGAATTGTTT 
AAAAAATTGG GCGCCTCCTT CTTTAGAGAA GGGCTCCTAG TGGAGGCAGT GGCGGGTAGC 
GGCTTTGAAA TGGCCTTCTC GGCCAGCCTG GGGAAGCTTG TGGAGCTGGG ATACACGGAG 
ACCGTCGACG GCGAGCAGGT CAAAGGCGAC GTCTACATCT TTCTCCTTGA CTACGTTAAG 
CGCCGCGGCG AGCTCCCAGC TATAAGAATA CCCGACTACG TCGAGGGCGT AGGCCCAGCG 
GCGCTTTATG AGTAG

Protein sequence

MRRAIRKALE LAERGVDKIV SELPTGYGKT VAAPLLYKRF RAAGLCWKAI HVFPLRAVLH 
TTLKRYVTEH PDIQFAYQDG DVTLRADGYV KDPWFTSEYV LTTYDSFIHN LLKAPVAEFH 
KLLSHGRGVH YHWPMAEVYP SCVFLDEVHL AVEGAKQVAA VSVVVNMLRE MEVPTVVLSA 
TMGRWKHDIF KDFVFVQLGE KDEEGDRLVV VRDEEFEKSM GEVEYSVDVI DENSVAALAR 
RKVKEGRRVL VVLNSLKKVV ALKNELGDLN PVLIHSMLTR RDRQAAEEEV KKAQLVIGTS 
AIEAGVDTSF DVLISDTPSA ESVVQRVGRV CRYGGRCKGE LYFFGEGAEE LREVKHWRLP 
YKKGSYAGLL REQIEKDRRL TWLYEMLARA LWIEDINELF KKLGASFFRE GLLVEAVAGS 
GFEMAFSASL GKLVELGYTE TVDGEQVKGD VYIFLLDYVK RRGELPAIRI PDYVEGVGPA 
ALYE