Gene Rsph17025_1657 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_1657
Symbol
ID	5082735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	1697725
End bp	1699050
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	72%
IMG OID	640483215
Product	RNA polymerase, sigma 54 subunit, RpoN
Protein accession	YP_001167855
Protein GI	146277696
COG category	[K] Transcription
COG ID	[COG1508] DNA-directed RNA polymerase specialized sigma subunit, sigma54 homolog
TIGRFAM ID	[TIGR02395] RNA polymerase sigma-54 factor

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.108649
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.937056
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCTTT ATACCGCTCA GAGCTTCGCG CAGCGTCAGT CGCTCGTCGT GACCGCGCAG 
TTGCAGCAGG CGATCTGCCT GCTCCAGATG CCCAACGCGG AACTGTCCTC GTTCATCGAG 
ACACAGTCCG AGGAAAACCC GTTCCTCGAG CTGCGGCTGC CCCCGGCGCC CGCGCCGTCC 
TCGGCGTTGC CCCGCAGCCA GGCGGCGGCG GGCGACGACT GGGACCGTGT GGCGGGCCTT 
GCCGCCGATC CGGGGCCGTC GCTCTATGTC CATGTCACCG CCGAGATCGC CCGGCTGGGT 
CTCACGGCCG AGGAGAGCGC CGCCGCCTCG GTCTTTCTGG ATGCGCTCGA ACCCTGGGGA 
TGGCTTGGCC AGCCGCTCGA GCTGCTGGCC CCGCGCGCGG GTCTCTCGCT CGAGGCGGCC 
GAGCGGCTGC TGGCGAAGCT GCACAGGATC GAACCGGCCG GTCTCTTCGC CCGCTCGCTC 
GCCGAGTGCC TGCGGCTGCA GGCCAGCGAG CAGGGGCTTC TGACGCCGCT CTTTGCCGCC 
GTGCTCGACC ATCTGTCGCT GCTGGCCGCC GCCGACCTGC GCGGGCTCTG CCGCGCCTGC 
GGCTGCGGCA TGGAGGAGCT GAAGGCCGTC CTGCGCCAGC TGCGCGGGCT CAATCCCAAG 
CCGGGTGCGC TGTTCGATGC CGCCCCCTCG CCGCAGCGCC CGCCGGATCT GCTGGTCAGC 
CCCGGCCCCG ATGGCTGGCG CGTGGATCTC AACCGCTCGA CACTGCCCAC GGTTGTGGTG 
CGCGCCGACA CGGCGCAGGA CTTCGCCGGA AGCGCCGCGC CCTATGTCGG CGAGCGGCTC 
TCGGTGGCCC GCTGGCTGGC CCGCGCGGTC GAGCACCGGA ACCAGACGAC GCTCAAGATC 
GGTGCGGAAG TGGTGCGCCG GCAGCGCGGC TTCCTCGAGG AGGGCCCGGC GCGGATGGAG 
CCGATGACGC TGCGCGAGGT GGCCGATGCG GTGGGCGTGC ACGAAAGCAC GGTGAGCCGC 
GTGAGCTCCG GTCTGATGAT CGCCACGCCG CAGGGCACCT TTCCGCTGAA GTCGTTTTTC 
ACGGCCGCTC TCTCGGCGCG CGAGGGGGAC ACGGCCGGTT CGGCCGCGGC CGTCCGCCAT 
CGCGTGCGCC AGCTGGTCCA GGCGGAGTCG CCGGATGATC CCCTGAGCGA CGATGCCATC 
GCCCGCATCA TCTCGGACGA GGGCGTGACG CTGGCCCGCC GCACGGTGGC CAAATACCGC 
GAGCAGCTCA ACATTCCGTC CTCGGTCCAG CGCCGGCGGC AGGCGCTGGT GACGGGCGCG 
CTCTAG

Protein sequence

MQLYTAQSFA QRQSLVVTAQ LQQAICLLQM PNAELSSFIE TQSEENPFLE LRLPPAPAPS 
SALPRSQAAA GDDWDRVAGL AADPGPSLYV HVTAEIARLG LTAEESAAAS VFLDALEPWG 
WLGQPLELLA PRAGLSLEAA ERLLAKLHRI EPAGLFARSL AECLRLQASE QGLLTPLFAA 
VLDHLSLLAA ADLRGLCRAC GCGMEELKAV LRQLRGLNPK PGALFDAAPS PQRPPDLLVS 
PGPDGWRVDL NRSTLPTVVV RADTAQDFAG SAAPYVGERL SVARWLARAV EHRNQTTLKI 
GAEVVRRQRG FLEEGPARME PMTLREVADA VGVHESTVSR VSSGLMIATP QGTFPLKSFF 
TAALSAREGD TAGSAAAVRH RVRQLVQAES PDDPLSDDAI ARIISDEGVT LARRTVAKYR 
EQLNIPSSVQ RRRQALVTGA L