Gene RPD_0178 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0178
Symbol
ID	4020635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	201922
End bp	203562
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	64%
IMG OID	637960356
Product	RNA polymerase factor sigma-54
Protein accession	YP_567319
Protein GI	91974660
COG category	[K] Transcription
COG ID	[COG1508] DNA-directed RNA polymerase specialized sigma subunit, sigma54 homolog
TIGRFAM ID	[TIGR02395] RNA polymerase sigma-54 factor

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.570253
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCTCA CGCAACGCCT CGAATTTCGC CAATCGCAGT CGCTGGTGAT GACGCCGCAG 
CTGATGCAGG CGATCAAGCT GCTGCAACTG TCCAATTTGG ATCTCGCGGT GTTCGTCGAG 
GACGAGCTCG AGAAGAACCC GCTGCTGGAC CGCGCCAGCG ACAACGCCGA ACCGCTGGTT 
GCCGGCGAAG CGTCGATGGA CCGCGCCGAG AATGCGGGTG ACGAGTTCGG CGGCAGCGAG 
GCCGGCGGCG AGGCATCGGA CTTCGCCGAC AACGCAGGCG GCGATTCCTT CGAGCCGGGC 
AGCGAAGAAT GGATGCACCG CGATCTCGGC AGCCGCAGCG AGATCGAGCA GACACTCGAT 
ACCGGCATGG AGAACGTGTT CCCGGAGGAG CCGGCCGAGG CTGCGGCCCG CGCCGCTCAG 
GACGCGGCGC CGGCGTCATA TACCGAGTGG GGCGGCGGCG CCTCCAGCGA CGAGGGCTAC 
AATCTCGAAG CCTTCGTTGC GGCCGAGACC TCGCTGGCCG ACCATCTCAG CGAGCAGCTC 
GCAGTCGCGC TGTCCTCACC ATCGGAACGC ATGATCGGGC AATATCTGAT CGACCTCGTC 
GACGATGCGG GCTACCTGCC AGCCGATCTC GGTGAGGCCG CCGAGCGTCT CGGAACGACC 
CAGACCGAAG TCGAAGCCGT GGTCGGCGTG CTGCAAACCT TCGACCCGCC GGGCATCTGC 
GCGCGTTCTT TGGCCGAATG CCTCGCCATT CAATTGCGTG AACTCGACCG GTTCGACCCG 
GCGATGCAGG CGCTGATCGA GCACCTCGAT CTCTTGGCCA AGCGCGACGT CGTCAGCTTG 
CGCAAGATTT GCGGCGTCGA TGACGAGGAC CTCGCCGACA TGATCGGCGA AATCCGTCAC 
CTCGATCCGA AACCTGGCCT GAAGTTCAAC TCCTCTCGCG TGCAGACCGT CGTGCCCGAT 
GTGTTCGTGC GCCCCGGCCC CGACGGAGGC TGGCTGGTCG AACTCAACAG CGACACGCTG 
CCGAAGGTGC TGGTCAACCA GTCCTATTAC TCGGAGTTGT CGAAGACGAT CCGCAAGGAT 
GGCGACAAAT CCTACTTCTC CGACTGCCTG CAGACCGCAA CCTGGCTGGT GCGCGCGCTC 
GACCAGCGCG CTCGCACCAT TTTGAAGGTC GCGACCGAGA TCGTGCGCCA GCAGGACGGC 
TTCTTCACCC ACGGCGTCGC GCATCTGCGA CCACTGAATC TGAAAGCGGT GGCCGACGCG 
ATCCAGATGC ACGAGTCGAC GGTGTCGCGC GTGACCGCCA ACAAATATAT GGCGACCAAC 
CGTGGCACGT TCGAACTGAA GTATTTCTTT ACCGCGTCAA TCGCCTCCGC CGATGGCGGC 
GAGGCGCATT CCGCCGAAGC CGTTCGTCAT CACATCCGGC AATTGATCGA TGGCGAGGAT 
CCGTCAGCAA TTCTGTCGGA CGACACGATC GTGGAGAGGC TGCGCGGAGC CGGCATCGAT 
ATCGCACGTC GTACCGTCGC GAAATATCGC GAGGCGATGC GCATCCCCTC GTCGGTGCAA 
CGGCGACGCG ACAAGCACAG CATGCTCGGC ACGGCCCTGA CGGCGCCAGC CGATCGGTCC 
CGCGACACCG CTCCGGCTTG A

Protein sequence

MALTQRLEFR QSQSLVMTPQ LMQAIKLLQL SNLDLAVFVE DELEKNPLLD RASDNAEPLV 
AGEASMDRAE NAGDEFGGSE AGGEASDFAD NAGGDSFEPG SEEWMHRDLG SRSEIEQTLD 
TGMENVFPEE PAEAAARAAQ DAAPASYTEW GGGASSDEGY NLEAFVAAET SLADHLSEQL 
AVALSSPSER MIGQYLIDLV DDAGYLPADL GEAAERLGTT QTEVEAVVGV LQTFDPPGIC 
ARSLAECLAI QLRELDRFDP AMQALIEHLD LLAKRDVVSL RKICGVDDED LADMIGEIRH 
LDPKPGLKFN SSRVQTVVPD VFVRPGPDGG WLVELNSDTL PKVLVNQSYY SELSKTIRKD 
GDKSYFSDCL QTATWLVRAL DQRARTILKV ATEIVRQQDG FFTHGVAHLR PLNLKAVADA 
IQMHESTVSR VTANKYMATN RGTFELKYFF TASIASADGG EAHSAEAVRH HIRQLIDGED 
PSAILSDDTI VERLRGAGID IARRTVAKYR EAMRIPSSVQ RRRDKHSMLG TALTAPADRS 
RDTAPA