Gene BURPS668_1148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1148
Symbol
ID	4882040
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1125940
End bp	1126965
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	69%
IMG OID	640127076
Product	deacetylases
Protein accession	YP_001058197
Protein GI	126438867
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGACGT ACTTCCACCC CGATCAATCA CTGCATCATC CGCGCACGTA CTTCTCGCGC 
GGCCGGATGC GCATGCCGCA GGAGGTGCCC GAGCGCGCGG CGCGGCTCGT CGCGGCGGCG 
TTCGCGATGG GTTTTCCGGT GCGCGAGCCG GACGATTTCG GCATCGCGCC GATCGCGGCC 
GTGCACGACA CGCACTACCT GCGCTTTCTC GAGACCGTGC ATCGCGAATG GAAGGCGATG 
CCGGAGGACT GGGGCGACGA AGCGATGTCG AATATTTTCG TGCGCGAGCC GAACGCGTTG 
CGCGGCGTGC TCGCACAGGC CGCCCGTCAT CTCGCGGACG GCAGTTGCCC GGTCGGCGAG 
CACACGTGGC GCGCGGCGTA CTGGTCCGCG CAGAGCGCGC TCGCGGCGGC GGCGGCGGTG 
CGCGACGGCG CGCCCGCAGC GTATGCGCTG TGCCGGCCGC CGGGCCATCA TGCGCGCGTC 
GACGCCGCGG GCGGCTTCTG TTATCTGAAC AACGCGGCGA TCGCCGCGCA GGCGCTGCGC 
GCGCACCATG CGCGCGTCGC CGTCCTCGAC ACCGACATGC ATCACGGGCA AGGCATACAG 
GAAATCTTCT ACGCGCGGCG CGACGTGCTG TACGTATCGA TTCACGGCGA TCCGACGAAC 
TTCTACCCGG CCGTCGCGGG CTTCGACGAC GAGCGCGGCG CGGGCGAAGG CCTCGGCTAC 
AACGTGAATC TGCCGATGCC GCACGGCTCG AGCGAAGCGG CGTTCTTCGA GCGCGTCGAC 
GATGCGCTGC GCGAGTTGCG GCGCTTCGCG CCCGATGCGC TCGTGCTGTC GCTTGGGTTC 
GACGTCTATC GCGACGACCC GCAATCGCAG GTGGCGGTGA CGACGGACGG TTTCGGTCGG 
TTGGGACACC TGATCGGCGC GCTGCGGCTG CCGACCGTCA TCGTGCAGGA AGGCGGCTAT 
CACATCGAGA GCCTCGAGGC GAATGCGCGG TCGTTCTTCG GCGGATTCGG CGCGCTGCGC 
GGTTGA

Protein sequence

MLTYFHPDQS LHHPRTYFSR GRMRMPQEVP ERAARLVAAA FAMGFPVREP DDFGIAPIAA 
VHDTHYLRFL ETVHREWKAM PEDWGDEAMS NIFVREPNAL RGVLAQAARH LADGSCPVGE 
HTWRAAYWSA QSALAAAAAV RDGAPAAYAL CRPPGHHARV DAAGGFCYLN NAAIAAQALR 
AHHARVAVLD TDMHHGQGIQ EIFYARRDVL YVSIHGDPTN FYPAVAGFDD ERGAGEGLGY 
NVNLPMPHGS SEAAFFERVD DALRELRRFA PDALVLSLGF DVYRDDPQSQ VAVTTDGFGR 
LGHLIGALRL PTVIVQEGGY HIESLEANAR SFFGGFGALR G