Gene Rsph17029_1704 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1704
Symbol
ID	4897364
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	1794121
End bp	1795437
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	70%
IMG OID	640112297
Product	RNA polymerase, sigma 54 subunit, RpoN
Protein accession	YP_001043586
Protein GI	126462472
COG category	[K] Transcription
COG ID	[COG1508] DNA-directed RNA polymerase specialized sigma subunit, sigma54 homolog
TIGRFAM ID	[TIGR02395] RNA polymerase sigma-54 factor

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000000294974
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCAGCTTT ACACCGCACA GAGCTTCGCA CAGCGCCAGT CGCTCGTGGT GACGGCACAG 
CTCCAGCAGG CCATCTGCCT GCTGCAGATG CCGAACGCCG AGCTGTCCTC GTTCATCGAG 
AGCCAGTCGG AGGAAAACCC TTTCATTGAA CTGCGCCTGC CGCCGGCGCC GGTGCCGTCC 
GCCCCTCTGG GCAAAACCGC ACCCGAGGAC TGGGACCGCG TGGCAGGGCT TGCCGCCGAT 
CCGGGGCCGT CGCTCTATGT GCATGTGGCC GCCGAGATCG CGCGTCTGGG GCTCGATGCC 
CCGCAAGCGG CGGCCGCCCA GGTCTTTCTC GACGCGCTCG AACCCTGGGG CTGGCTCGGT 
CGCCCGATGG AGGAACTTGC CTTCCGCGCG GGCCTGTCGC TCGAGGCGGC CGAGGCGCTG 
CTCGCCCGGC TTCAGAAGAT CGAACCCGCA GGGCTCTTTG CGCGCACGCT TGCCGAATGC 
CTGCGGCTTC AGGCGGAAGA GCAGGGGCTG CTCACCCCGC TGTTCGCCGC CGTTCTCGCG 
CATCTCCCGC TGCTGGCTGC GGCCGATCTC AAGGGCCTGT GCCGCGCTTG CGGCTGCGGG 
ATGGAGGATC TGAAGGCCGT GCTGCGCAGC CTGCGCGGTC TCAATCCCAA GCCGGGCGCG 
CTGTTCGATG CCGCCCCTCC GCCCCAGCGA CCGCCGGATC TGTTGGTCAG CCGCGGCGCC 
GAAGGCTGGC GGGTGGATCT GAACCGCTCG ACGCTGCCGT CCGTCGTGGT GCGCTCGGAT 
GCGGCGGAAG GCTTCGCCCG GACGGCCGCG CCCTATGTGG GCGAGCGGCT GTCGGTCGCG 
AAGTGGCTTG CAAGGGCCGT CGAGCACCGC AACCAGACCA CGCTCAAGAT CGGCGCCGAG 
GTGGTCCGCC GTCAGCGCGG CTTCCTCGAG GAGGGGCTGG CGCGCATGGC GCCCATGACG 
CTGCGCGAAG TGGCCGATGC GGTGGGCGTG CATGAGAGCA CCGTCAGCCG GGTGAGCTCG 
GGGCTGATGA TCGCCACGCC GCAGGGCACC TTCCCGCTGA AGTCGTTTTT CACCGCAGCG 
CTGGCCGCCC GCGAGGGCGA CACGGCGGGA TCGGCCGCCG CTGTCCGGCA CCGCGTCCGC 
CAGCTCGTGC AGGCGGAATC GCCCGACGAT CCGCTGAGCG ACGATGCGAT CGCAAAGATC 
ATTTCCGACG AGGGCGTGAC GCTCGCCCGG CGCACCGTCG CCAAATATCG CGAGCAGCTG 
AACATCCCCT CGTCGGTGCA GCGCCGCCGT CAGGCCATCG TCACCGGCGC ACTCTGA

Protein sequence

MQLYTAQSFA QRQSLVVTAQ LQQAICLLQM PNAELSSFIE SQSEENPFIE LRLPPAPVPS 
APLGKTAPED WDRVAGLAAD PGPSLYVHVA AEIARLGLDA PQAAAAQVFL DALEPWGWLG 
RPMEELAFRA GLSLEAAEAL LARLQKIEPA GLFARTLAEC LRLQAEEQGL LTPLFAAVLA 
HLPLLAAADL KGLCRACGCG MEDLKAVLRS LRGLNPKPGA LFDAAPPPQR PPDLLVSRGA 
EGWRVDLNRS TLPSVVVRSD AAEGFARTAA PYVGERLSVA KWLARAVEHR NQTTLKIGAE 
VVRRQRGFLE EGLARMAPMT LREVADAVGV HESTVSRVSS GLMIATPQGT FPLKSFFTAA 
LAAREGDTAG SAAAVRHRVR QLVQAESPDD PLSDDAIAKI ISDEGVTLAR RTVAKYREQL 
NIPSSVQRRR QAIVTGAL