Gene BURPS668_0547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0547
Symbol	rpoH
ID	4884666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	519518
End bp	520453
Gene Length	936 bp
Protein Length	311 aa
Translation table	11
GC content	66%
IMG OID	640126475
Product	RNA polymerase factor sigma-32
Protein accession	YP_001057600
Protein GI	126441976
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02392] alternative sigma factor RpoH [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.118318
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCAACG CATTGACCCT TCCGAACACA CTGCGCCCGG CGTCCGCTAA GGCCGTATCG 
GCGGGCTCGC TGACGCTCGC CTCTCATTCG ATGCTGCCCG GCCATCTGGG CAACATCGAC 
GCCTATATCC AGGCTGTGAA CCGGATTCCG CTGCTAAGCG CGGAGGAAGA GCGTCAATAC 
GCGACCGAAT ACCGCGAGCA AAACAATCTC GACGCCGCGC GCCGGCTCGT GCTGTCGCAC 
CTGCGGCTCG TCGTGTCGGT CGCGCGCAAC TACCTCGGCT ACGGCCTGCC GCACGGCGAT 
CTGATCCAGG AAGGCAACAT CGGCCTGATG AAGGCGGTCA AGCGGTTCGA TCCCGCCCAG 
AACGTGCGCC TCGTGTCGTA CGCGATCCAC TGGATCAAGG CCGAGATTCA CGAGTACATC 
CTGCGCAACT GGCGCATGGT CAAGGTGGCG ACGACGAAGG CGCAGCGCAA GCTGTTCTTC 
AATCTGCGCA GCCACAAGAA GGGCACGCAG GCGTTCACGC CGGAGGAAAT CGACGGCCTC 
GCGCAGGAGC TGAACGTCAA GCGCGAGGAA GTGGCCGAGA TGGAAACCCG CCTGTCGGGC 
GGCGACATCG CGCTCGAAGG CCAGATCGAC GACGGCGAGG AATCGTACGC GCCGATCGCC 
TATCTCGCCG ATTCGCACAA CGAGCCGACC GCCGTGCTCG CCGCGCGGCA GCGCGACATG 
CTGCAGACGG ACGGCATCGC GCGCGCGCTC GAATCGCTCG ACGCGCGCAG CCGCCGGATC 
ATCGAGGCGC GCTGGCTGAA CGTCGACGAC GACGGCTCGG GCGGCTCGAC GCTGCACGAT 
CTCGCGGCCG AATTCGGCGT GTCGGCGGAG CGCATCCGCC AGATCGAGGC AAGCGCGATG 
AAGAAGATGC GCACGGCGCT CGCCGCGTAC GCATAA

Protein sequence

MSNALTLPNT LRPASAKAVS AGSLTLASHS MLPGHLGNID AYIQAVNRIP LLSAEEERQY 
ATEYREQNNL DAARRLVLSH LRLVVSVARN YLGYGLPHGD LIQEGNIGLM KAVKRFDPAQ 
NVRLVSYAIH WIKAEIHEYI LRNWRMVKVA TTKAQRKLFF NLRSHKKGTQ AFTPEEIDGL 
AQELNVKREE VAEMETRLSG GDIALEGQID DGEESYAPIA YLADSHNEPT AVLAARQRDM 
LQTDGIARAL ESLDARSRRI IEARWLNVDD DGSGGSTLHD LAAEFGVSAE RIRQIEASAM 
KKMRTALAAY A