Gene Pars_1679 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1679
Symbol
ID	5054293
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1515964
End bp	1517277
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	58%
IMG OID	640469220
Product	S-adenosyl-L-homocysteine hydrolase
Protein accession	YP_001153882
Protein GI	145591880
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0499] S-adenosylhomocysteine hydrolase
TIGRFAM ID	[TIGR00936] adenosylhomocysteinase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGAGT CCCGCGTCAG GGATCCATCG TTGGCAGATA GGGGCAGGGA ACAGCTCTAC 
TGGGCAGAGC GGAATATGCC CGTGTTGATG GAAATAAGGA AGAGGTTTGA GAAGGAGAAG 
CCCCTCGCCG GGCAAGTCGT CGCGGCGTGT CTCCACGTTA CTAAGGAGAC GGGGGTGCTG 
GTGCGCACGC TGGCGGCGGG AGGGGCGCAG GTGGTGCTTA TACCCTCAAA CCCCCTCTCC 
ACGCAAGACG ACGTCGCCGC CGCCTTGGCG CAGGAGGGCA TCTACGTCTA CGCGTGGCGC 
GGCATGTCTG ACAGGGAATA CTACAACGCC ATCGGCTTCG CCCTCTCGTT CAACCCCACA 
ATCACGCTAG ACGACGGCGC CGACTTAACC GCAACAATAC ACAAGATAGG CTACGGTGTT 
AGGGATCATA CAATTGACTA CGTGACGGAG GTGGCGGGCC CCCTGGACGG TGGGAAGCTC 
CTTTCGAGGC TGAGGGGAGG CACCGAGGAG ACCACCACAG GAGTGATTAG GTTAAGAGCG 
CTGAAAAAGG CGGGCAAACT CTTGTACCCA GTAATTGCTG TAAATGAATC GTACACCAAA 
TACCTCTTCG ACAACAGATA CGGCACCGGC CAGTCCACTT GGGACGGCGT GATGCGGGCA 
ACCAACTTGC TGATTGCTGG TAAAAACGTC GTCGTGGCGG GCTACGGCTG GGTGGGGAGG 
GGCATAGCCA TAAGGGCCAG AGGCCTAGGC GCCAGGAGGG TAATAGTCGT CGAGGCCGAT 
CCGATCCGGG CACTGGAGGC GGTCTTCGAC GGCTTCGAGG TCATGCCTAT GGACAAAGCT 
ACGGAGGTCG GCGACATATT CATAACGGCC ACGGGGAATA TAAGAGCCAT CAACCTGGGC 
CACATCTTTA AGATGAAAGA CGGCGCCGTG TTGGCCAACG CGGGGCACTT CAATGTGGAG 
ATAGACGTGG CCGGCTTGGA GCGGATAGCA GTAGCCAAGA GGAGGATAAG GCCCTACCTG 
GAGGAATACG CCTTGCCGAA CGGCAGGCGC GTCTACCTAA TAGGAGAGGG CCGCCTCGTG 
AACCTAGTCG CTGCGGAGGG CCACCCGTCT GAGGTCATGG ACCTATCCTT CGCCAACCAG 
GCCCTGGCCG CTGAGTACAT CGCCAAGAAC AATCTGCAGG TAGACGTCTA CAAGCTACCG 
GATGAAATTG ACAGAGAAGT GGCGAGGCTA AAGCTCAAGA CGATGGGCAT AGAGGTTGAG 
GAGTTGACGG AGGAGCAGAG GCTGTACATC TCGTCGTGGG AGCTTGGAAC ATAA

Protein sequence

MPESRVRDPS LADRGREQLY WAERNMPVLM EIRKRFEKEK PLAGQVVAAC LHVTKETGVL 
VRTLAAGGAQ VVLIPSNPLS TQDDVAAALA QEGIYVYAWR GMSDREYYNA IGFALSFNPT 
ITLDDGADLT ATIHKIGYGV RDHTIDYVTE VAGPLDGGKL LSRLRGGTEE TTTGVIRLRA 
LKKAGKLLYP VIAVNESYTK YLFDNRYGTG QSTWDGVMRA TNLLIAGKNV VVAGYGWVGR 
GIAIRARGLG ARRVIVVEAD PIRALEAVFD GFEVMPMDKA TEVGDIFITA TGNIRAINLG 
HIFKMKDGAV LANAGHFNVE IDVAGLERIA VAKRRIRPYL EEYALPNGRR VYLIGEGRLV 
NLVAAEGHPS EVMDLSFANQ ALAAEYIAKN NLQVDVYKLP DEIDREVARL KLKTMGIEVE 
ELTEEQRLYI SSWELGT