Gene Pars_2236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2236
Symbol
ID	5055833
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	2003681
End bp	2005033
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	55%
IMG OID	640469789
Product	TIP49-like protein
Protein accession	YP_001154434
Protein GI	145592432
COG category	[K] Transcription
COG ID	[COG1224] DNA helicase TIP49, TBP-interacting protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.385068
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTCTA TTAAAATTGA AGAGGTAAAC ACCTCCCTGG AGAGGTTTGC GGCCCACAGC 
CACATTAAGG GGCTGGGAGT TAGAGATGGG AAAGTCCAAT TTGTGGCTGA CGGCTTTGTG 
GGGCAGACCG AGGCGCGGGA GGCCGCTTAC ATAATTGTCC AGATGATTAA GGAGGGAAAG 
TTCGCAGGGA GGGGTGTACT TATCGTCGGC CCCCCGGGCA CGGGGAAGAC GGCGCTGGCT 
TTGGGAATAG CCCGGGAGCT GGGCCCGGAG ACGCCCTTTG TGGCGATCTC CGGCGGCGAG 
ATATACTCGC TTGAGGTGAA GAAGTCGGAG TTTTTGATGA GGGCTCTGAG GAGGGCCATA 
GGGATTAGGA TTAGGGAGTG GAGGAAGGTA TATGAGGGAG AGCTGAGGTC TATTGATATT 
AGATATGGGC GCCACCCCTA CAACCCATAC CTGCAGAGGG TGTTGGGGGC CACCATCAAG 
CTGAGGACTC GGGACGAGGA GAAGACGCTG AGGGTGCCGG CTGAGATTGC GCAACAGCTA 
ATTGAGCTCG GCGTGGAGGA GGGGGACGTG ATTATGATAG ACGAGGAGAC AGGCGCTGTG 
TCGCTGGTGG GCAGAGGCGA GGGCGGCGAG CAATACGACG TGGGTAGGAG GAGGATCGAG 
CTCCCCAAGG GGCCCGTCTA CAAGGAGAAG GAGATAGTCA GGTTCTACAC GCTTCACGAT 
GTGGACATGT CCCTGGCCAG GCAGAGGGGG CTGATCTCGG CCATGCTGTT CGGCTTTGCC 
GAGGAGGTAA AGGAGATCCC AGAAGAGATT AGGAGGCAGA GCGACGAAAT AGTCAAGAAA 
GTACTAGAGG AAGGCAAGGC GGAGCTGGTG CCAGGAGTGT TGTTCATCGA CGACGTCCAC 
CTCCTCGATA TAGAGAGCTT CTCATTCTTA ATGAGGGCTA TGGAGACGGA GTTTGCCCCC 
ATCATAATTA TGGCCACCAA TAGGGGGATT GCAAGGATTA GGGGTACTGA CATAGAGGCG 
CCGCACGGAA TCCCCCAGGA CATGCTGGAT AGACTCGTCA TTATTCGTAC TCGGCCCTAT 
ACGGCTGAGG AGATACGCGA GATTATCTCC ATAAAGGCGA ATGAGCAGAA GGTACCGCTG 
ACCAAAGAGG CCCTTGATCT CCTCACATCA ATAGGCGTAG ACCACTCGCT GAGGTACGCC 
CTCCAGTTGT TGACGCCGGC TTATATAGTC GCAAAAGAAC GCGGCAAGGG GTCTGTGGGC 
AGAGAGGAGA TAGAAGAGGT GAGGAGGCAT TTCGTTTCGG TGAAGGAGTC CGTGGAGTAC 
GTGAAGTCGC TGGAGGAGAA GTTTTTAAGA TAG

Protein sequence

MSSIKIEEVN TSLERFAAHS HIKGLGVRDG KVQFVADGFV GQTEAREAAY IIVQMIKEGK 
FAGRGVLIVG PPGTGKTALA LGIARELGPE TPFVAISGGE IYSLEVKKSE FLMRALRRAI 
GIRIREWRKV YEGELRSIDI RYGRHPYNPY LQRVLGATIK LRTRDEEKTL RVPAEIAQQL 
IELGVEEGDV IMIDEETGAV SLVGRGEGGE QYDVGRRRIE LPKGPVYKEK EIVRFYTLHD 
VDMSLARQRG LISAMLFGFA EEVKEIPEEI RRQSDEIVKK VLEEGKAELV PGVLFIDDVH 
LLDIESFSFL MRAMETEFAP IIIMATNRGI ARIRGTDIEA PHGIPQDMLD RLVIIRTRPY 
TAEEIREIIS IKANEQKVPL TKEALDLLTS IGVDHSLRYA LQLLTPAYIV AKERGKGSVG 
REEIEEVRRH FVSVKESVEY VKSLEEKFLR