Gene Rsph17029_2179 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2179
Symbol
ID	4895952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2309501
End bp	2310805
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	72%
IMG OID	640112773
Product	RNA polymerase, sigma 54 subunit, RpoN
Protein accession	YP_001044054
Protein GI	126462940
COG category	[K] Transcription
COG ID	[COG1508] DNA-directed RNA polymerase specialized sigma subunit, sigma54 homolog
TIGRFAM ID	[TIGR02395] RNA polymerase sigma-54 factor

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.570526
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0685307
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACATGA TGCAGTTCCA GCGTCAGACG ACCCAGCTGG CCATGACCCA GCGGATGCAG 
GAGTCGCTGC GGATCCTGCA GATGAGCAAC GCCGATCTCG CCGACTATCT GACGGCGCAG 
GCGCTGGAAA ATCCCTGCCT CGAGGTGCGC GTGCCCGAAG GGACGTCGGT CGCCCCCGCG 
CTGCCCTCGC GCGGGATCCA GGCGGGGCTC GACCGCGATG CCTTCGCCAC CGTCGAGGGC 
CAGCCGCCGA GCCTTCTGGC CCATGTCGAG GCGCAGATCG ATCTGGCCTT CTTCGATCCG 
GGCGACCGGC GCACGGCCCT GGCCTTCGCC GAGGCGCTGG AGCCCTCGGG CTGGCTCGGC 
CAGCCCGTCT CCGAGATCGC CGCCGCGGCC GAGGTGGAGG AGGAGGAGGC GCTGGTCATC 
CTCGAGCGGT TGCAGGCCTT GGAGCCCGCG GGCCTCTTCG CCCGGTCGCT GGCCGAATGC 
CTCGCGCTGC AGCTCGAGGA TCTGGGGCTG CTGACCTGGG AGCTGCGCAC GATGCTCGAC 
CATCTGCCGC TTCTCGCCGA GGGGCGGATC GCCGATCTCG CCCGCCGCTG CGACTGCGAG 
CCCGAGCATA TCCGCGAGAA TCTGGCGCTG ATCCGCAGCC TGAGCCCCAA GCCCGGCGAG 
GCCTTCGCGG CCGACCGCAC GCCGATCCAG CCGCCCGACG TGCGCGTGCT GCGCGGCCCG 
GAGGGCTGGG AGGTCGAGCT CACCCGGGCG CAGCTGCCCC GCATCCGGGT CAGCGAGGCA 
GGAGACACCG GCGACCGGCA GGCCGACGCC TGGCTCGCCC GCGCCCGCTC GCAGGCGCGC 
TGGCTGGAGC GGGCGGTCGA GCGGCGGCAG GCCACGCTCC TGCGCACCGC CGTCTGCCTC 
GTGCGCCATC AGGCCGACTT TCTCGATCAG GGGCCGCGCG CGCTCCGGCC GCTGTCGATG 
GAGGAGGTGG CGCTGGAACT CGACCTCCAT CCCTCGACCA TCAGTCGCGC CACCGCCACC 
CGGCTGATCG AGACGCCGCG CGGGCTGATC CCGCTGCGCG CCTTCTTCAG CCGGTCGGTC 
TCCTCGGACG GGCCCGAGGC GCCGCAGTCG CAGGATGCGC TGATGGCGCT CGTGCGCGAC 
ATCATCGCGC GCGAGGATCG CACGAAACCC TTCTCGGACG ATGCGATCGT GAAGCAGGCG 
AAGCTCGCGG GCGCGGTTCT GGCCCGGCGC ACCGTCACCA AATATCGCGA GACGCTGGGG 
ATCCCCTCGT CCTACGACCG CAAGCGCGCC GCCGCCGCGG CCTGA

Protein sequence

MDMMQFQRQT TQLAMTQRMQ ESLRILQMSN ADLADYLTAQ ALENPCLEVR VPEGTSVAPA 
LPSRGIQAGL DRDAFATVEG QPPSLLAHVE AQIDLAFFDP GDRRTALAFA EALEPSGWLG 
QPVSEIAAAA EVEEEEALVI LERLQALEPA GLFARSLAEC LALQLEDLGL LTWELRTMLD 
HLPLLAEGRI ADLARRCDCE PEHIRENLAL IRSLSPKPGE AFAADRTPIQ PPDVRVLRGP 
EGWEVELTRA QLPRIRVSEA GDTGDRQADA WLARARSQAR WLERAVERRQ ATLLRTAVCL 
VRHQADFLDQ GPRALRPLSM EEVALELDLH PSTISRATAT RLIETPRGLI PLRAFFSRSV 
SSDGPEAPQS QDALMALVRD IIAREDRTKP FSDDAIVKQA KLAGAVLARR TVTKYRETLG 
IPSSYDRKRA AAAA