Gene Pars_0534 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0534
Symbol
ID	5055282
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	480931
End bp	481917
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	67%
IMG OID	640468096
Product	alcohol dehydrogenase
Protein accession	YP_001152781
Protein GI	145590779
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.83673
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGGCTG TTGTCTTCCA CAGCCCTGGG CTTGAGAACC TCAGGCTGGA GGATCTCCCG 
AAGCCGCGGC CGGGGCCGGG CGAGGTTCTT GTCAGGGTTA AATACGTGGG GGTGAACCCC 
ATCGACTACG CGGTGGTTTC CGGCTCGTAC AAGGCGTCGC CCATGCCCCA CATCCCGGGG 
TGCGAGTTCG CTGGGGTGGT TGAGGAGGTG GGGCCCGGCG TCTCGGGGCC TGCGCCTGGC 
ACGCCGGTGG CCGTCTACAA CCGCCTCTTT TGCGGCGCCT GTAGGCAGTG CCTCACCGGG 
TGGACTCAGC TCTGCGAGGC CGGCGGCATA ATAGGCGTGG CGACCCAGGG TGGCATGGCT 
GAATATGCCG TGGTGCCCTC CAGGAATGCG GAGCCTGTGA AGGCGGATCT GAGGGACGCC 
GCCACGCTCC CCATAGGCGC GTTGACTGCC TACAACATGG CTCTGTGCGC CTCGATAGCC 
CCCGGGGAGA GAGTCGCCGT TGTGGGCGCC ACGGGGAACG TGGGGACATA CGCAGTACAG 
TTCGCCAAGA TCTTCGGCGG CGAGGTATAC GCTGTGACCA GGAGGAAGGA TGCCGCCGCG 
GCAATGTTGC GGCAACTAGG CGCGGAGGTA GTCACGCCGG ACGAAGCCCG GGGGCTCGCC 
CCCTTCGACG TGGTGCTGGA CCCAACGGGC GCCGCCAACT GGGGCCTCAG CATGTCTCTG 
CTGGGCCGCG GCGGGCGGTA CGTCACAGCG GGGGCCCTAA CAGGCGCCGA AGTCTCTCTG 
GACCTCAGGC GGGTGTTTGG ACAGCAGATC TCAGTGATAG GCTCCACCGG CGGCAGGAGG 
GCGGACTTCA AGACGGTGGT GAGACTCCAC GAGGCGGGGA GGATAAGGGC GGTGATACAC 
GCAGTGTATC CGCTGGCCGA CGCCGCCAAG GCCCTCGCCG GCCTCAGCTC GCCCGCGAGG 
GTCGGCAAGA TCCTGCTGGA GGTATGA

Protein sequence

MRAVVFHSPG LENLRLEDLP KPRPGPGEVL VRVKYVGVNP IDYAVVSGSY KASPMPHIPG 
CEFAGVVEEV GPGVSGPAPG TPVAVYNRLF CGACRQCLTG WTQLCEAGGI IGVATQGGMA 
EYAVVPSRNA EPVKADLRDA ATLPIGALTA YNMALCASIA PGERVAVVGA TGNVGTYAVQ 
FAKIFGGEVY AVTRRKDAAA AMLRQLGAEV VTPDEARGLA PFDVVLDPTG AANWGLSMSL 
LGRGGRYVTA GALTGAEVSL DLRRVFGQQI SVIGSTGGRR ADFKTVVRLH EAGRIRAVIH 
AVYPLADAAK ALAGLSSPAR VGKILLEV