Gene Pars_0503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0503
Symbol
ID	5055869
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	454514
End bp	455647
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	59%
IMG OID	640468065
Product	ATPase
Protein accession	YP_001152750
Protein GI	145590748
COG category	[R] General function prediction only
COG ID	[COG1672] Predicted ATPase (AAA+ superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.241974
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTGTAC CAGCTCTCTT CAAGCTAGAG CCCAAGGAGT CCTTGGAGGA GCTGTACGAC 
TTTGAGAAGG AGCTGGAGGA GCTGAGGAGG GGGTATGAAG ATGGGAGGAT TGTGGCTGTG 
CTGGGGCTTA GAAGGATGGG GAAGTCCAGC CTTTTGAGGA GCTTTCTAAA CAGCTTTTCC 
ATCCCCCATG TCTATATTGA CGCCAGGCGC GTGGCGGTGG CTACGGGGAG GGCCACGACT 
AGGGGGTTTA TGGAGGAGTT GGGAAGAGCG CTGGCCGAGT TTATGAGGAG GGAGGCGCCG 
CTGAGGGATA AGCTGGCCGA GGCGTTGAGG AGGGTGAGGG GGGTCAGCGT GGGCCTCAGC 
CCCGTGACAG TGTCGCTCAG CTGGGGGAGG GAGCGGGCCG ACTTAATTTC GCTACTGGAG 
GCTGTTGACG AGGTAGTGGG CCGGGCGGCG AGGCGGCTGG CGTTGGCAAT TGACGAGGTG 
CAAGAGCTAC GGGGAATAGG AGTGGATATA CCCCGCCTCC TTGCCTATAT CTACGACAAT 
TTGCACAACG TAGTGGTGTT CGTGTCGGGG TCGCAGGTCG GGCTCCTCTA CGACGTGCTT 
GAGCTCGACC GCCCCCAGTC CCCTCTCTAC GGCAGGGCCG TGTTTGAGGT GAAAATGAGG 
AGGCTGAGGA GGGAGGAGGC GGTGGACTTC TTGAAGAGGG GCTTCCAGCA GGCGGGCATC 
AGTATCAACC AGCAGGAGCT TGAAGAGGCT GTGGACTCAC TCGACGGGAT AATCGGCTGG 
CTTACCTACT TCGGCTGGTC GAGGGTCGTG GGGGCGAAGT CCCTTGAAGA GATCCTCGAC 
GCCGCCGCTA GGCAGGAGGC GGAGGAGATA TCGAGGTTTC TAGCTAAGTC GCGTTCCGAG 
GATAGGTACA GGGCAATTTT AAAAGCCGTC GCCGCGATGC CGATGAGGTG GTCTGAGATC 
AAGAGGGTTT TAGAGGCGGA GGAGGGAGCC GCAGTAGACG ACCGGAACTT CACCGACCTG 
CTCCACCGCT TGGAAAAGGT GGGGCTTTTA GAAAAGAGGG AGGGGTTATA CGCGATTCCT 
GACCCTGTGG TTAGGCTTGC AGTGGAGAGG TACATAAGCA AGGCTCCTGC GTAA

Protein sequence

MVVPALFKLE PKESLEELYD FEKELEELRR GYEDGRIVAV LGLRRMGKSS LLRSFLNSFS 
IPHVYIDARR VAVATGRATT RGFMEELGRA LAEFMRREAP LRDKLAEALR RVRGVSVGLS 
PVTVSLSWGR ERADLISLLE AVDEVVGRAA RRLALAIDEV QELRGIGVDI PRLLAYIYDN 
LHNVVVFVSG SQVGLLYDVL ELDRPQSPLY GRAVFEVKMR RLRREEAVDF LKRGFQQAGI 
SINQQELEEA VDSLDGIIGW LTYFGWSRVV GAKSLEEILD AAARQEAEEI SRFLAKSRSE 
DRYRAILKAV AAMPMRWSEI KRVLEAEEGA AVDDRNFTDL LHRLEKVGLL EKREGLYAIP 
DPVVRLAVER YISKAPA