Gene BURPS1710b_A1345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A1345
Symbol	rpoN
ID	3694157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	-
Start bp	1656150
End bp	1657625
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	70%
IMG OID	637731599
Product	RNA polymerase factor sigma-54
Protein accession	YP_336502
Protein GI	76819614
COG category	[K] Transcription
COG ID	[COG1508] DNA-directed RNA polymerase specialized sigma subunit, sigma54 homolog
TIGRFAM ID	[TIGR02395] RNA polymerase sigma-54 factor

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGCCA CGCTCGCGTT GCAAATGCGT CAACACCTGG CGCTCACGCC GCGCTTGCAG 
CAGTCGCTGC GTTTGCTCCA GCTTTCGTCG CTCGAGTTTC AACAGGAACT GCGTCAGGCG 
CTCGATACCA ATCCGTTTCT CGAAGACGTG CAATCGCCCG ACGACGATGC TGCCGAAGCC 
GCGCCGAAGC CGGGCGAGAC GCCCGCCGCC GACGCAAACG CGAGGGCGGA CGACGGCTAC 
GCCGAGCGCG ACGAGGGCCC GTTCGCGACC GACGCGTCGC CGCCCGCCGG CCAGGACGTG 
CCGCTGACGG CGGAGCTCTC GGCGCGCGGC TCGAGCCGGC GCTCCGACGA CGCGTCGGAT 
CTCGAGCCCG GCGACTGGAT GACGGCCGAG CCGACGCTGC ACGAGCATCT GCACGACGCG 
CTGCGCCTTT GCCAGCTCAC CCGGCGCGAC CGCACGCTCG CGCGCATGAT CATCGACGCG 
CTCGACGACG ACGGCTATCT GCGCCAGGCG CTGCCCGAGC TCGCGGCGGC GGCCGATCCG 
CTGCTGCATC CGGCCGAGCA GGAACTGCTC GTCGCGCTGC GGCTCGTGCA GTCGCTCGAT 
CAGCCCGGCA TCGGCGCGCG CACGCTGTCC GAATGCCTGT TGCTGCAGCT CGACGCGATG 
CCGGCGGACA CGCCGGGCGT CGAATGCGCG AAGGAGATCG CCGCGCATCA CCTCGAGCGT 
CTCGCACGCC GCGAGACGGC CGAGATGCAG CGCCGCATCG GCTGCGACAC GCACACGCTG 
CGCATCGCAT GCACGCTCGT GCGCCGGCTC GATCCGCGCC CCGGCAACCA GTACGGCAGC 
ACGGCGGGCA ACTATGTCGT CCCCGATGTG ATCGTGCGGC AGGTGCGCAA CGACTGGCTC 
GTCACGATCA ACCCCGCCGT GATGCCGCGC GCGCGCATCC ATCGCCGCTA CGCGGAGCTG 
TTCGCGCAAT CGAGCGGCTC GAATCAGTCG CCGCTCGGCC AGCAACTGCA GGAGGCGCGC 
TGGCTGATCC GCAACGCGCA GAAGCGTTTC GACACGATCC GCCGCGTCGG CGAGTGCATC 
GTCGAGCGGC AGCGCGACTT TTTCCGCTAC GGCGAGATCG CGCTGAAGCC GCTCGTGCTG 
CGCGACATCG CCGACGAGCT CGGCCTGCAC GAATCGACGA TCTCGCGCGC GACCGGCAAC 
AAGTACATGT CGACGCCGCA CGGCACGTTC GAGTTCAAGC ACTTCTTCCC GCGCAAGCTC 
GAGGCGGCGG GCAAGGGCGC GTGCTCGGCG GCCGTCGCGA GGGTGCTGAT CCGCGACATG 
ATCGCGGCCG AACAGGCGAT CGATCCGCTG TCGGACGTCG CGCTCGCGCA GCGTCTGGCG 
GGGCGCGGGA TCGTGCTCGC GCGCCGCACC GTCACGAAGT ATCGGCAGGC GATGAAGATC 
CCGCCCGCGG AATTGCGCCG CCGCGCGCCT CTATGA

Protein sequence

MSATLALQMR QHLALTPRLQ QSLRLLQLSS LEFQQELRQA LDTNPFLEDV QSPDDDAAEA 
APKPGETPAA DANARADDGY AERDEGPFAT DASPPAGQDV PLTAELSARG SSRRSDDASD 
LEPGDWMTAE PTLHEHLHDA LRLCQLTRRD RTLARMIIDA LDDDGYLRQA LPELAAAADP 
LLHPAEQELL VALRLVQSLD QPGIGARTLS ECLLLQLDAM PADTPGVECA KEIAAHHLER 
LARRETAEMQ RRIGCDTHTL RIACTLVRRL DPRPGNQYGS TAGNYVVPDV IVRQVRNDWL 
VTINPAVMPR ARIHRRYAEL FAQSSGSNQS PLGQQLQEAR WLIRNAQKRF DTIRRVGECI 
VERQRDFFRY GEIALKPLVL RDIADELGLH ESTISRATGN KYMSTPHGTF EFKHFFPRKL 
EAAGKGACSA AVARVLIRDM IAAEQAIDPL SDVALAQRLA GRGIVLARRT VTKYRQAMKI 
PPAELRRRAP L