Gene Pars_1060 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1060
Symbol
ID	5055925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	944121
End bp	946229
Gene Length	2109 bp
Protein Length	702 aa
Translation table	11
GC content	60%
IMG OID	640468616
Product	hypothetical protein
Protein accession	YP_001153290
Protein GI	145591288
COG category
COG ID
TIGRFAM ID	[TIGR01451] conserved repeat domain

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.655402
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCGGA ACATATCACT GGCGGTCATC GCCTTTGCGG CGGTACTCGC CTACGCCCAA 
GCAGTGGTCG GACTCGCTTC TTCTGTGGAC TACCTCTGGC TTGGCGCCAA GTGGAGCCAA 
GTACCTAAGT TCCCCGGAGA CGTTGGGGTT GTGACCCTCT CCTTTTATGT GTCAAGCCAA 
TACGTCGACG TTACCATCTC CCTAGACCCT AAGTGCGGCT ACGTGGCCCC TCTTGAGGAC 
GTTAGGCTCC CCTCCGCCGG CCCAGGAGTG GTGTCGGCAA ACCTCAAGGT ACTAGCCTAC 
GCGCTGAACG TCACGTGCCC CGCAAACGCC ATATTCAACG CCAGGTATAA GGCAGTGGGC 
GGCTCTCTGA CAGACGGCGT CACCAATGTT GAGTACGTCT CGCTCTACGT CCCGCCGTAC 
CCGACGTACG ACGTCTCAGC AAGGGGCACG GCATACCTGG GCATGCCCAG CAGGATAACG 
CTAGTTTTCA AAAGCCCCTA CTCCACGGCC TCCACCGCAA CGGTGCAGGG CCAGGGGGTT 
AGGGTTCTTT CCCCCTCCGG CCAGTTCTCC GTAAACGGGA CCTATGCAGA AGTGCCGCTG 
GTCGTCATCG CCGACTCGCC CTCTGCCTCG TTGTTGGTGT CTGTGCAGTC CCGGGACTGG 
CTGGGCAACC CGGTGGCGCT GACGTACACA GTGCCTATCG CCGCGGCTCC CGCCCCGCCT 
TCGGTTATGT ACGTATCGCC CACCGCCTTG TCGCTTAACA AGTACAACAA GGTGAACGTC 
ACCATACAGC TCCCCGTTGA GGCTGACGGC ACGGCTGTAA TCGCGGCGGC AGGCGCAGTC 
ATGCCGCAGT CAAGCATAAC TATACCCATA AGCCGGGGGA GGGGCTACGC CGTGCTGGAG 
GTCTACCCCG TCTTCTCAGT TGTGACCTTC ACTGCACAAG TGACATACCA AGTCACCGGC 
GTGGCCAAGA CGGAGCAGAT CTCGGCGTCG GCAGCTACCC AGCAGACCAT AGGCGGCTTG 
GCCAAGGTGG AGGTAAGGCC CCCAAGGCTG ATGGCCGGCG TGGCCAATAA CGTAACGCTA 
TCCGTCTCGG CGCCGGGCGC CTTCAACGTC TCAGTCGCTG TAGCGAACGC CGCCGTCGAC 
AAGCCACAGC CCTACTACTT CGGCGGGGTA GACAAGGCAA CTGCCAGCCT CCTGGTGACG 
CCTTTGTCGA GCCAACCTGT CACCTTCACT GTGACGGTGT ATCACAGCGC CGGGACAGAT 
CAGTACACCA TCACCCTTCC GGTCACTTCG GCAAGCATAT TCACAGTAAT ACCGAATCCG 
TCTTTGGTTA AGTCTGGCGG AAACCGCACA GTTGTCGTTA CCGTGATAAA CAGCGGCGAC 
GTGGCTGTGC AGAAGGCGGT GGTCACAATC TCCCCCGCCA CGTCGAACGT GGTGGCCTCC 
ACCTACACCT TCCAGCTAGG GAGGGTGGCG CCGCTTGAAA GCGTCCAGCT CCCCATATCC 
TTCATAGTCC CCGCCACCTA CAGCGGCGCC ATGGCCTTTA CCTACAACAT AATCTACACC 
ACAGAGCTCG GCACCACCGG CTCGTCCCAG GGCACCTTCT ACCTACAAGC CTTACAAAGC 
CCAGCGGTCA ACGTCACCTC CGTAACCGTC GTGCCGCAGT TCCCGGAGGC CCGCAGGACT 
TTCTACATCT CCGTGACGGT GGTGAACAAG GGCTTCGCCC CAGTGACCAA CCTCCAGGTT 
GAGGCCAGCC CGCCGCGGGG CATTAGGCCG GTCACGGCGC CTATATACTT CGCCGGCCAG 
CTCGACCCCC AGCAGACGGC CAACATACCC CTGAGCTTCA ACGCCACTGC GCCGGGCCAG 
TACCAAATAC CCCTCGTCAT ATCCTACACG GATCAGTACG GTAACTTCTA CACAATCCCG 
TACACGGTCA CTGTGACAGT CTCCAACGGG ACGCGACTCT TCGGTACTAT CCGTCAGGGA 
ACGCCGATTC AGGGCGGATC AAGTCAGCCA GGGCAAGGCG GCACGATAGT CGGGGCGGGG 
GTTGCGATGG TGGTTGCGGC GGCTGTTGTC GCCGTTTTGT ACATGAGGCG GAGAGCCAAG 
AGGTCATGA

Protein sequence

MIRNISLAVI AFAAVLAYAQ AVVGLASSVD YLWLGAKWSQ VPKFPGDVGV VTLSFYVSSQ 
YVDVTISLDP KCGYVAPLED VRLPSAGPGV VSANLKVLAY ALNVTCPANA IFNARYKAVG 
GSLTDGVTNV EYVSLYVPPY PTYDVSARGT AYLGMPSRIT LVFKSPYSTA STATVQGQGV 
RVLSPSGQFS VNGTYAEVPL VVIADSPSAS LLVSVQSRDW LGNPVALTYT VPIAAAPAPP 
SVMYVSPTAL SLNKYNKVNV TIQLPVEADG TAVIAAAGAV MPQSSITIPI SRGRGYAVLE 
VYPVFSVVTF TAQVTYQVTG VAKTEQISAS AATQQTIGGL AKVEVRPPRL MAGVANNVTL 
SVSAPGAFNV SVAVANAAVD KPQPYYFGGV DKATASLLVT PLSSQPVTFT VTVYHSAGTD 
QYTITLPVTS ASIFTVIPNP SLVKSGGNRT VVVTVINSGD VAVQKAVVTI SPATSNVVAS 
TYTFQLGRVA PLESVQLPIS FIVPATYSGA MAFTYNIIYT TELGTTGSSQ GTFYLQALQS 
PAVNVTSVTV VPQFPEARRT FYISVTVVNK GFAPVTNLQV EASPPRGIRP VTAPIYFAGQ 
LDPQQTANIP LSFNATAPGQ YQIPLVISYT DQYGNFYTIP YTVTVTVSNG TRLFGTIRQG 
TPIQGGSSQP GQGGTIVGAG VAMVVAAAVV AVLYMRRRAK RS