Gene Pars_0026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0026
Symbol
ID	5055222
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	19392
End bp	20507
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	55%
IMG OID	640467606
Product	hypothetical protein
Protein accession	YP_001152295
Protein GI	145590293
COG category	[S] Function unknown
COG ID	[COG1415] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGACTTG CCGGAACGGC GGATTTGCCT CTTCACGACG GTACAGTGCC GTACTGGTTG 
CTTTCCAGGA TGAAGAAGCT GGCATCGCTT GTATTAACCA TTATGCACGA TATATACGGC 
CCAGACGGCA TTGTGGAGAG GTTTGCCCAT CCTGTATTTT TCCAGGCGTT TAATGATCTC 
ATCGGGATGG ATTGGGACAG CTCCGGCAGT ACTACCGTCA CTACTGCCGT TGTTAAGGAG 
GCGTTGTCCA AGTCCGAGAT CCCGGTTAGA GTGGCAGGGG GCAAGGGGAG GCAGGCCTTA 
AACGCGCCGA ACGAACTGGC GGAGATATCC CGGCAATTTA ATCTAGACGC CGAGAGGCTA 
ATCGCCACTT CTAGGCTAGT GGCGAAAGTG GACAACGTAT TGGTGCAAGA CGGCTACGAC 
TTGTACCACC ACGCCTTCTT CGTCTCCTCC ACCGGCAGGT GGGCGGTGGT ACAACAAGGC 
TTAAATCCAG AAGTTAGGAT GGCTCGTCGG TACCACTGGC TCGCTACTGA AAACTACTTT 
GACAGCCCCC ACACCGGCGT GGTGGGCGTA AAGCGCAATA GAGTGCTCAA CTTGGCGTCG 
GCAAAGAGCA GAGAGAATAG GTCCGTCATC CTAGAACTCG TAAACGAGGG GGCAACGAAG 
GTGGCGAAAT ACCTCGCGCT TCTACGCGGA CAAGCGACTC TCTTCGACGT ACCAAGATAC 
CACCCCTATA CGAAAATCGA CATAGAAGTA AGGACAGTTG TGAAGAATTT GCCCCCGCCC 
AAGTCGGTAA CCGACTTCAA GGAGCTTCTT CTGCAATACC GCGTGGGACC TAAAACCCTC 
CGGGCCCTTT CGCTGGTGGC GGAGCTTGTG TTTAAGACCC CCGCCGACTG GAACGACCCG 
GCAACGGACC CATTCAAATT CGCCTTCGCA GTAGGCGGAA AGGACGGCAT ACCCTACCCC 
GTTGATAGAA GGACATACGA CGAGCTCATA GCTATACTCG ACGTCGTGGT GGACAAGGCA 
AGGAGTGATC CAGGCCTCTA CCGCTACCTT TCTCACCTAG CCAAGAAGGC CGAGGCGTGG 
AGATACCCCC AAGACAAGAA AAAGCCGACG CTTTAA

Protein sequence

MRLAGTADLP LHDGTVPYWL LSRMKKLASL VLTIMHDIYG PDGIVERFAH PVFFQAFNDL 
IGMDWDSSGS TTVTTAVVKE ALSKSEIPVR VAGGKGRQAL NAPNELAEIS RQFNLDAERL 
IATSRLVAKV DNVLVQDGYD LYHHAFFVSS TGRWAVVQQG LNPEVRMARR YHWLATENYF 
DSPHTGVVGV KRNRVLNLAS AKSRENRSVI LELVNEGATK VAKYLALLRG QATLFDVPRY 
HPYTKIDIEV RTVVKNLPPP KSVTDFKELL LQYRVGPKTL RALSLVAELV FKTPADWNDP 
ATDPFKFAFA VGGKDGIPYP VDRRTYDELI AILDVVVDKA RSDPGLYRYL SHLAKKAEAW 
RYPQDKKKPT L