Gene Pisl_0381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pisl_0381
Symbol
ID	4617613
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum islandicum DSM 4184
Kingdom	Archaea
Replicon accession	NC_008701
Strand	-
Start bp	368250
End bp	369260
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	48%
IMG OID	639783461
Product	histone deacetylase superfamily protein
Protein accession	YP_929902
Protein GI	119871895
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.0601969
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGTGT ATTATTCGCC AATATTTAAA AAACACACGC CGCCGTTTAG ACATCCAGAG 
GCGCCAGATA GACTAGACCA CTTGTTAGAG GGGGCTCGGG AGGCCGGGGC CGAGATAAAG 
GAGCCCGTTA TGCGCGAAGA CGTCTGGCAC ATTATAGAGT CTATACACGA CAAGAGCTAT 
GTAGAGCTAG TACGTAGACT TTGTAGAGAA GGACATGCCG AAATCGACGG CGATACATAC 
ATATCAAGCG GTACATGCGA TGCCGCAGCG TTAGCCGTGT CCGCGATTAT AAACGCAGTG 
GAGAGAAAAG AGACGGCGTT AATTGCGGCA AGACCGCCGG GTCACCACGC CGGGGTTGCC 
GGTAGAGCTC TCTCTGCGCC AAGTCAAGGG TTTTGTATCT TTAATACAGC TGCTATAGGC 
GCACTTTATG GAGAAGAGGG AGTAGCCGTA TTAGACATAG ACGTACATCA CGGTAATGGC 
ACACAGGAAA TACTATATGA CAGAGATCTG TTGTATATCT CTACACATCA ACATCCGCTC 
ACGCTCTACC CAGGCACGGG ATATCCCGAA GAGGTGGGAG AGGGCAAGGG GGAGGGCTAC 
AATATAAATA TCCCACTGCC GCCTCATACT GGCGACGATG TGTACATCAA AGTAATTGAC 
GAGATTATAA CATCTGTGTT GAGACAATAC AACCCTCGTC TTGTGATAAT CTCACTAGGT 
TGGGATGCGC ATAAGGAAGA TCCCCTAGCC GATATGAAAC TATCGCTTAA AAGCTATCTC 
TACGTCTTTG AAACAGTATT ACGTCTACAG AAGCCTGTAA TATTTCTACT TGAAGGCGGC 
TACAACCGTG AGGTGATAAG AAGAGGTACA AAAGCTCTCA TTAGACTAGC AGACGCTGGG 
GAGTTTGCCC CAGGCGAAAG CCAAACTTCT ACAGACGTAC ACACCTTAGA GAAGTTTGAA 
GAAATTATAA AGGAGGTCAA GAGCTACGTC GGCCGATATT GGAGATTATA G

Protein sequence

MLVYYSPIFK KHTPPFRHPE APDRLDHLLE GAREAGAEIK EPVMREDVWH IIESIHDKSY 
VELVRRLCRE GHAEIDGDTY ISSGTCDAAA LAVSAIINAV ERKETALIAA RPPGHHAGVA 
GRALSAPSQG FCIFNTAAIG ALYGEEGVAV LDIDVHHGNG TQEILYDRDL LYISTHQHPL 
TLYPGTGYPE EVGEGKGEGY NINIPLPPHT GDDVYIKVID EIITSVLRQY NPRLVIISLG 
WDAHKEDPLA DMKLSLKSYL YVFETVLRLQ KPVIFLLEGG YNREVIRRGT KALIRLADAG 
EFAPGESQTS TDVHTLEKFE EIIKEVKSYV GRYWRL