Gene Pars_0461 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0461
Symbol
ID	5055435
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	405809
End bp	408175
Gene Length	2367 bp
Protein Length	788 aa
Translation table	11
GC content	59%
IMG OID	640468026
Product	protein of unknown function DUF699, ATPase putative
Protein accession	YP_001152711
Protein GI	145590709
COG category	[R] General function prediction only
COG ID	[COG1444] Predicted P-loop ATPase fused to an acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.340301
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATTTTTG ACGTTGTTAA GGCAGAGGTG GAGAGGGCTA GGACAGCTCG CCACAGGAGG 
CTAGTGGTGG TCACTGGGGG GGACGACAAG AAGCTAGCGG AGGCGGCGGC AGAGGCGCTT 
AAGGCCTACG AGGCGGCGGG GGGCGGCGGG GAGGGGCTGT ACATGTTCCA GCCCGAGTTC 
GCAGACGCCA ACAGGAGGAT GAACTACTTC AGAGACGCCA TGTCGGGGAC GTTTCTGGAG 
GTGGATTTCA GGCCTTATAA AGACACGCCT AAGTTGCTCG GCACCACATA CAACTTCGCC 
GTTTTGGATC TAGTCAACGA CTTAAAGCCC AACGACGTCG GGCGCCTCGG CGGCGTGGTG 
AGGGGCGGGG GGCTATACGT CTTTTTGGTG CCGCCTTTAG AGACGTGGAG GGGTTACGTG 
ACTAAGTTCC AATCTACGCT CCTGGTGCCT CAGTTCACCC CGGCTGACTT GAGGCACAGG 
CTGAAGGAGC GGTTCTGGCG TAGCCTATAT AGCCACGGGG GCGTTGTGAT ATATGACGCA 
GATCGCGGCG AGGTGTTGAA GGGGTCTGGC ATAGATGTAG TGGAGCCCTA TGAGCCAAAG 
AGGCCGGAGC CGCCGGAGAA GGCTGTAATC CCCTTGAAGA TATACCGCCT CGCCGCTACC 
CAGGACCAGG TAGAGGTGCT CAAGTTATTC GAGGCGCTGT ACAGTAAGCC GAAGAGAAAG 
CAGGCAATTG TCGTTATAGC CGATAGGGGG AGGGGTAAAA GCGCGGCGCT GGGGCTCGGC 
CTCGCGGGGC TGGGCCACAA GCTCAGGAAG GCGAAGGCCA GGGTCCAAAT CGTGGTTAGC 
GCCATGGAGT ACACAAACCT GGAGACGCTT CTAGAATTCG CCGTCAAGGG CCTAGAAGCC 
TTGGGCTACA AGCCGGGTCT TGAGAAGGAG GGCGGGGAGA TAAGGGCGAT TAAGGCGAGC 
GGGATCTTCA TAGACGTGGT TACGCCGTAT ATGTTGCTCA AGCGCGAAAA CGCCGACATA 
GTCGCCATCG ACGAGGCCGC CGCGGTGCCT CTGCCAGTGC TCTACACCGT CCACAAGAAG 
TTCGACCGGG TGGTCTTCGC CTCGACGATC CACGGCTACG AGGGGGCAGG CCGCGGCTTC 
TCCATACGCT TCCTCAAATA CCTCAGAGAA TCTAAAGACA CAGACGTCCA CCTCTACGAG 
ATGAGAGAGC CTATTAGATA CGGCCCCGGC GACCCGGTAG AGCGTTGGCT CTTCGACGTG 
TTCCTCCTAA ACGCCGAGCC TGCTAAGATC GAGCCGGAGG ATCAAGAATA CGTCAAGAGG 
AAGGAGGTGG TCTACCTAAA AGAGGAGGAC GTCGTGAAAG ACGAGGAGGC GTTTAGGCAG 
TTCTTCGGCA TCTACGTACA GGCCCACTAC AGAAACGAGC CCGACGACCT GGGCATGCTC 
CTAGACGCGC CGCACCACAC AGCCAGGGCG TTGGCTCTCC CCAACGGCAA AATCGTGGTC 
TCGGTGGAGC TGGCCTACGA GGGGGGCCTA GACGACCTCT CCATAGACCA GGCGCTTAGG 
GGGCTGAAGC TGCCTGGCAA CATTATTCCA GACCGCTTCC TTAAGTACTG GCGCCTCCCC 
GAATTCGCCA AGCTGAGGGG GTGGCGAATA GTGAGGATTG CCACCCACCC AGAGCTACAA 
GACATGGGCC TCGGCACAGA GATGCTGAAA AAAGTCGAGG AGGAGGCGAG GCAACTCGGC 
TTGGACTACG TCGGGGTTGG ATTCGGCGTC TACGACAAGC TCCTCAAGTT CTGGGTTAGG 
AACGGCTACG TCCCCATCCA CCTCTCCCCC GAGCGCAACC CATCGTCTGG GGAGTACAGC 
GTCTTACTGG TTAAACCCCT CAACGAGAAG GCTGAGGCCT ATGTTAAGTA CGCAAACGTC 
GAGTTTAGGC GGCGCCTGGT CCACTCGCTC ATGGGGCCCT ATAGCGACCT CTTACCCACC 
GAGGTTAGGC TCCTCCTAGA GGACTGGGGC TGGGACATAG ACGGCGCCCC CGCCCTCTCC 
AAGAACCAGC TGGACAGGCT GGTGGCATAC GCATTCGGCC CCATGACTTA CGAAAACGTG 
ACCGACGCCG TGTACATGCT CGCCACCCAG TACTTCTACT CCGCCAGGAC AAGAAGACCT 
ACGTTGCCCG AGGTGGCCGA GCGCATACTT ATTAGTAAGG TGCTACAAGC CCGCCCGTGG 
AAAGACGCAG CTGAGGCGGC AGGCATCAGG AGAGGCGACC TAATGCTGGT ACTAAGAGAG 
ATTGTGAAGG TCCTGCTCTT CTACTACTAC GGCGGGGAGT TCGACGTCCC GCTCTTCGTC 
GTCGGCACCG TGAAGGGAAA AGACTAA

Protein sequence

MIFDVVKAEV ERARTARHRR LVVVTGGDDK KLAEAAAEAL KAYEAAGGGG EGLYMFQPEF 
ADANRRMNYF RDAMSGTFLE VDFRPYKDTP KLLGTTYNFA VLDLVNDLKP NDVGRLGGVV 
RGGGLYVFLV PPLETWRGYV TKFQSTLLVP QFTPADLRHR LKERFWRSLY SHGGVVIYDA 
DRGEVLKGSG IDVVEPYEPK RPEPPEKAVI PLKIYRLAAT QDQVEVLKLF EALYSKPKRK 
QAIVVIADRG RGKSAALGLG LAGLGHKLRK AKARVQIVVS AMEYTNLETL LEFAVKGLEA 
LGYKPGLEKE GGEIRAIKAS GIFIDVVTPY MLLKRENADI VAIDEAAAVP LPVLYTVHKK 
FDRVVFASTI HGYEGAGRGF SIRFLKYLRE SKDTDVHLYE MREPIRYGPG DPVERWLFDV 
FLLNAEPAKI EPEDQEYVKR KEVVYLKEED VVKDEEAFRQ FFGIYVQAHY RNEPDDLGML 
LDAPHHTARA LALPNGKIVV SVELAYEGGL DDLSIDQALR GLKLPGNIIP DRFLKYWRLP 
EFAKLRGWRI VRIATHPELQ DMGLGTEMLK KVEEEARQLG LDYVGVGFGV YDKLLKFWVR 
NGYVPIHLSP ERNPSSGEYS VLLVKPLNEK AEAYVKYANV EFRRRLVHSL MGPYSDLLPT 
EVRLLLEDWG WDIDGAPALS KNQLDRLVAY AFGPMTYENV TDAVYMLATQ YFYSARTRRP 
TLPEVAERIL ISKVLQARPW KDAAEAAGIR RGDLMLVLRE IVKVLLFYYY GGEFDVPLFV 
VGTVKGKD