Gene Pisl_1949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pisl_1949
Symbol
ID	4618134
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum islandicum DSM 4184
Kingdom	Archaea
Replicon accession	NC_008701
Strand	+
Start bp	1763251
End bp	1764222
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	65%
IMG OID	639785040
Product	alcohol dehydrogenase
Protein accession	YP_931439
Protein GI	119873432
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0237239
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	9.46914e-17
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTAGCGG CTAGGCTCTA CGGCCCGCGC GACTTGCGCG TCGAGGAGAT TCCGGCGCCC 
AAGCCAGAGC GGGGGTGGGC GCTGGTGAGA ACGCTGGCGG TGGGGATCTG CGGCACAGAC 
AAGGCCTTCT ACAGGGGGAC CTACCGGCTG TTTAAGACGC CTCTTGTACC GGGCCACGAG 
GCGGTGGGGG TGGCGGAGGG GGGCGAGTTG GACGGGAGGG TGGTGGTGAG CGAGATCAAC 
TTCGCCTGTG GTAGGTGTGA GATGTGTAGA GCTGGTCTCT ACACGCACTG CCCCTACAAG 
AGGACGCTTG GGATAGACTT CGACGGGGGG ATGGCGGAGT ACTTCGTGGC GCCTCTCGAG 
GCCCTCCACC CCGCCGAGGG GCTGGACCCA GCCGCCGCCA CTCAGGTAGA GCCGCTGGCG 
GCTGTGTTGA ACGCCCTTGC CCAGGTGCCG CCTCCGCCGG GGGCGAAGGT GGCTATCCTG 
GGGACGGGGA ACGTGGCCTA CCTCGCGGCG CAAGTCCTCC GGGGGTTCGA CCCCGTAGTG 
GTGGCTAGGC GGGGGAGCGC CAAGGCGCAC CTCTTCAGGG GGCTGGGGCT GGAGGTGGTG 
GAGTTGGGCG AGCTGGGTGA GTACATGGCG GAGAACGCGC CGCTGGGGTT CGACGTCGTG 
TTTGAGGCCA CTGGCGACCC CTCTGCGATT AATACGGCTA TAGAGATAGC GAGGCCCCGC 
GGCGTGATAC ACCTAAAGTC CACCCCCGGC TCCCCCGCCC CCGCCAACCT AACGCCGGCG 
GTGGTCAAAG AGCTGAGGAT AGTGGGCACT AGATGCGGCA CATACAGAGA GTTCAGACAC 
GCCATCAAGC TCATTAGAGA AGGCATCGTG AAGCCCCTCA TCACCTCCGT AGTAACGGGG 
ATACACAACG CGAGAGAGGC TTTCGAGAGG GCCCTCCAAC CCAACGAGGT AAAGGTAGTA 
CTGAAGCCCT AG

Protein sequence

MLAARLYGPR DLRVEEIPAP KPERGWALVR TLAVGICGTD KAFYRGTYRL FKTPLVPGHE 
AVGVAEGGEL DGRVVVSEIN FACGRCEMCR AGLYTHCPYK RTLGIDFDGG MAEYFVAPLE 
ALHPAEGLDP AAATQVEPLA AVLNALAQVP PPPGAKVAIL GTGNVAYLAA QVLRGFDPVV 
VARRGSAKAH LFRGLGLEVV ELGELGEYMA ENAPLGFDVV FEATGDPSAI NTAIEIARPR 
GVIHLKSTPG SPAPANLTPA VVKELRIVGT RCGTYREFRH AIKLIREGIV KPLITSVVTG 
IHNAREAFER ALQPNEVKVV LKP