Gene BURPS1106A_2375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2375
Symbol
ID	4901099
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2347068
End bp	2348177
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	68%
IMG OID	640135604
Product	histone deacetylase family protein putative
Protein accession	YP_001066637
Protein GI	126454301
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAAAA CCGCTTTCTT CACCGACGAA CGCACTTTCT GGCACACGGG CGGCGCGCAT 
GCGCTGTTCT TTCCGGTCGG CGGCTGGGTG CAGCCGCCGT CGAGCGCGGG CTATGCGGAA 
TCGCCCGATT CGAAGCGGCG CCTGCTGTCG CTCGTGCACG CGTCCGGGCT CGCGGCGAAA 
CTCGACATGT CGAGCGCGCC CGCCGCGACC GACGACGATC TGCGGCGCAT CCACCCCGCG 
CACTACCTCG ACGCGTTCAA GCGCGCGAGC GACGCGGGTG GCGGCGATCT CGGCGAACTC 
GCGCCGTTCG GCCGTGGCAG CTACGAGATC GCGGCGCTAT CCGCGGGGCT CGCGCTCGCC 
GCCGTCGACG CGGTGCTCGC CGAGCGCACG GCCAACGCGT TCTCGCTGTC GCGCCCGCCC 
GGCCATCACT GCCTGCGTGA CAAGCCGATG GGTTTTTGCC TGCTCGCGAA CATTCCGATC 
GCGATCGAGG CCGCGCGCGC GAAACATCGC GTCGAGCGCG TCGCGGTGAT CGACTGGGAC 
GTGCATCACG GCAACGGCAC GCAGTCGATC TACTACGACG ATCCGAACAC GCTGACGATC 
TCGCTGCATC AGGACCGCTG CTTTCCGCCC GGCTACAGCG GCGCCGACGA ACGCGGCGCG 
GGCGCGGGTG CGGGCTCGAA CGTCAACGTC CCGCTCCTCG CGGGCGCCGG CGACGACGCG 
TATCGATACG CATTCGAGCG AATCGTGCTG CCCGCGCTCG ATGCGTTCCG GCCGGAGCTC 
GTCATCGTCG CGAGCGGGCT CGACGCGAAT GCGGTCGACC CGCTCGCGCG GATGCAACTG 
CACAGCGACA GCTACCGGTA CATGACGCAT GCGCTGAAGC AGGCCGCGCA GCGGCACTGC 
GGGGGACGGC TCGTCATCGT GCACGAGGGC GGTTATTCGG AGGCCTACGT ACCGTTTTGC 
GGGCATGCGA TCGTCGAGGC ACTGGCGGGC ATGCGCACCG ACGTCGCCGA TCCGATGCTC 
GAGCTCGCGA TCGCGCAACA GCCCGGCGAG CGTTTCAACG CATTCCAGCG GCAACTGATC 
GACGAAATGG CGACGAGCTT CGGTTACTGA

Protein sequence

MTKTAFFTDE RTFWHTGGAH ALFFPVGGWV QPPSSAGYAE SPDSKRRLLS LVHASGLAAK 
LDMSSAPAAT DDDLRRIHPA HYLDAFKRAS DAGGGDLGEL APFGRGSYEI AALSAGLALA 
AVDAVLAERT ANAFSLSRPP GHHCLRDKPM GFCLLANIPI AIEAARAKHR VERVAVIDWD 
VHHGNGTQSI YYDDPNTLTI SLHQDRCFPP GYSGADERGA GAGAGSNVNV PLLAGAGDDA 
YRYAFERIVL PALDAFRPEL VIVASGLDAN AVDPLARMQL HSDSYRYMTH ALKQAAQRHC 
GGRLVIVHEG GYSEAYVPFC GHAIVEALAG MRTDVADPML ELAIAQQPGE RFNAFQRQLI 
DEMATSFGY