Gene BURPS668_A3119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A3119
Symbol	rpoN
ID	4886549
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	2959332
End bp	2960807
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	70%
IMG OID	640133055
Product	RNA polymerase factor sigma-54
Protein accession	YP_001064110
Protein GI	126443717
COG category	[K] Transcription
COG ID	[COG1508] DNA-directed RNA polymerase specialized sigma subunit, sigma54 homolog
TIGRFAM ID	[TIGR02395] RNA polymerase sigma-54 factor

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.194904
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGCCA CGCTCGCGTT GCAAATGCGT CAACACCTGG CGCTCACGCC GCGCTTGCAG 
CAGTCGCTGC GTTTGCTCCA GCTTTCGTCG CTCGAGTTTC AACAGGAACT GCGTCAGGCG 
CTCGATACCA ATCCGTTTCT CGAAGACGTG CAATCGCCCG ACGACGATGC TGCCGAAGCC 
GCGCCGAAGC CGGGCGAGAC GCCCGCCGCC GACGCAAACG CGAGGGCGGA CGACGGCTAC 
GCCGAACGCG ACGAGGGCCC GTTCGCGACC GACGCGTCGC CGCCCGCCGG CCAGGACGTG 
CCGCTGACGG CGGAGCTCTC GGCGCGCGGC TCGAGCCGGC GCTCCGACGA CGCGTCGGAT 
CTCGAGCCCG GCGACTGGAT GACGGCCGAG CCGACGCTGC ACGAGCATCT GCACGACGCG 
CTGCGCCTTT GCCAGCTCAC CCGGCGCGAC CGCACGCTCG CGCGCATGAT CATCGACGCG 
CTCGACGACG ACGGCTATCT GCGCCAGGCG CTGCCCGAGC TCGCGGCGGC GGCCGATCCG 
CTGCTGCATC CGGCCGAGCA GGAACTGCTC GTCGCGCTGC GGCTCGTGCA GTCGCTCGAT 
CAGCCCGGCA TCGGCGCGCG CACGCTGTCC GAATGCCTGT TGCTGCAGCT CGACGCGATG 
CCCGCGGACA CGCCGGGCGT CGAATGCGCG AAGGAGATCG CCGCGCATCA CCTCGAGCGT 
CTCGCACGCC GCGAGACGGC CGAGATGCAG CGCCGCATCG GCTGCGACAC GCACACGCTG 
CGCATCGCAT GCGCGCTCGT GCGCCGGCTC GATCCGCGCC CCGGCAACCA GTACGGCAGC 
ACGGCGGGCA ACTATGTCGT CCCCGACGTG ATCGTGCGGC AGGTGCGCAA CGACTGGCTC 
GTCACGATCA ACCCCGCCGT GATGCCGCGC GCGCGCATCC ATCGCCGCTA CGCGGAGCTG 
TTCGCGCAAT CGAGCGGCTC GAATCAGTCG CCGCTCGGCC AGCAACTGCA GGAGGCGCGC 
TGGCTGATCC GCAACGCGCA GAAGCGTTTC GACACGATCC GCCGCGTCGG CGAGTGCATC 
GTCGAGCGGC AGCGCGACTT TTTCCGCTAC GGCGAGATCG CGCTGAAGCC GCTCGTGCTG 
CGCGACATCG CCGACGAGCT CGGCCTGCAC GAATCGACGA TCTCGCGCGC GACCGGCAAC 
AAGTACATGT CGACGCCGCA CGGCACGTTC GAGTTCAAGC ACTTCTTCCC GCGCAAGCTC 
GAGGCGGCGG GCAAGGGCGC GTGCTCGGCG GCCGTCGCGA GGGTGCTGAT CCGCGACATG 
ATCGCGGCCG AACAGGCGAT CGATCCGCTG TCGGACGTCG CGCTCGCGCA GCGTCTGGCG 
GGGCGCGGGA TCGTGCTCGC GCGCCGCACC GTCACGAAGT ATCGGCAGGC GATGAAGATC 
CCGCCCGCGG AATTGCGCCG CCGCGCGCCT CTATGA

Protein sequence

MSATLALQMR QHLALTPRLQ QSLRLLQLSS LEFQQELRQA LDTNPFLEDV QSPDDDAAEA 
APKPGETPAA DANARADDGY AERDEGPFAT DASPPAGQDV PLTAELSARG SSRRSDDASD 
LEPGDWMTAE PTLHEHLHDA LRLCQLTRRD RTLARMIIDA LDDDGYLRQA LPELAAAADP 
LLHPAEQELL VALRLVQSLD QPGIGARTLS ECLLLQLDAM PADTPGVECA KEIAAHHLER 
LARRETAEMQ RRIGCDTHTL RIACALVRRL DPRPGNQYGS TAGNYVVPDV IVRQVRNDWL 
VTINPAVMPR ARIHRRYAEL FAQSSGSNQS PLGQQLQEAR WLIRNAQKRF DTIRRVGECI 
VERQRDFFRY GEIALKPLVL RDIADELGLH ESTISRATGN KYMSTPHGTF EFKHFFPRKL 
EAAGKGACSA AVARVLIRDM IAAEQAIDPL SDVALAQRLA GRGIVLARRT VTKYRQAMKI 
PPAELRRRAP L