Gene RoseRS_0191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_0191
Symbol
ID	5207126
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	237364
End bp	238572
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	59%
IMG OID	640593821
Product	RpoD family RNA polymerase sigma factor
Protein accession	YP_001274577
Protein GI	148654372
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02393] RNA polymerase sigma factor RpoD, C-terminal domain [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000166048
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00192271
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAAATCAA TGCAAGAAGG TAGACACATG GCCACCGAGA TCGTGGAGCA GACACAACAG 
GCGTGGGCGC AAACCCTCGA GTATCTGCTG GAAATCGGGC GCACACGCGG GTTCCTTACC 
TACAACGAAA TCCTTGAAGC GTTACCGCAA CCTGAGCACC ACATTGCTGA TGTTGATCAA 
CTCTATGCTT CCCTTCAAGC AGAGGGCATT CGCGTCGTCG AAACCCCGCT CGACATCCAC 
GACAACGGTT CGACCGGCGA CGATGAGTTG CTGGCGGATA TGCCCGACCT GACCGATGTG 
GCGCTCGATG ATCCGGTCCG CATGTATTTG CAGGAGATCG GTCAGGTTCC ACTCCTGTCG 
GCGGAACAGG AAGTCATGCT GGCAAAGGCG ATGGAAGCCG GTCACCGTGC GCGTCGCGCG 
CTCGAACGCG AAGAGTACAG CTCCTGGCAG GAGCGCGTGA TGTACGAGCA GCAGGTCGCG 
CAGGGGAATG AGGCGCGCCA GCACCTGATC CAGGCCAACC TGCGACTGGT CGTTTCGATT 
GCCAAGAAGT ACACATCGTA TGGGCTGACG ATGATGGACC TGGTGCAGGA GGGCAATATC 
GGTCTCATGC GCGCAGTCGA AAAGTTCGAC TATACCAAAG GGCACAAATT CTCCACGTAT 
GCCACATGGT GGATCCGCCA GGCGATCACC CGCGCCATCG CCGATCAGAG CCGCACCATT 
CGTCTGCCGG TGCATATGGG TGAGGCGATC AGCCAGGTGA AGCGTACCTC GCACAAACTC 
CAGCAGACGA TGCAGCGCGA ACCTACGCCG GAAGAGATCG CCGACGCAAT GGGCATCAGT 
TCGACGAAGG TACGCCGCAC GCTGGAGGCG TCGATGCACC CGCTCTCGCT CGAAATGCCG 
GTCGGGCAGG AAGGTGAAGG GCGGATGGGC GACTTTATCG AAGACGACCG GATCTCGACG 
CCGGCTGAGG CTGCTGCGGC TTCGATGTTG CGTGAGCAAC TTGAAGAGGT GTTGCAGAAG 
CTGCCGGAGC GCGAGCGCAA GATTATTCAG TTGCGCTACG GCTTGAAAGA TGGGCGGTAT 
CGCACGCTTG AAGAGGTCGG CATGGAGTTT GGCATTACGC GCGAACGCAT CCGCCAGATC 
GAAGCGGTGG CGCTTCGAAA ATTGCGCCAT CCGCACCTCG GTAAGAAGTT GCGCGGCTAT 
CTCGATTGA

Protein sequence

MKSMQEGRHM ATEIVEQTQQ AWAQTLEYLL EIGRTRGFLT YNEILEALPQ PEHHIADVDQ 
LYASLQAEGI RVVETPLDIH DNGSTGDDEL LADMPDLTDV ALDDPVRMYL QEIGQVPLLS 
AEQEVMLAKA MEAGHRARRA LEREEYSSWQ ERVMYEQQVA QGNEARQHLI QANLRLVVSI 
AKKYTSYGLT MMDLVQEGNI GLMRAVEKFD YTKGHKFSTY ATWWIRQAIT RAIADQSRTI 
RLPVHMGEAI SQVKRTSHKL QQTMQREPTP EEIADAMGIS STKVRRTLEA SMHPLSLEMP 
VGQEGEGRMG DFIEDDRIST PAEAAAASML REQLEEVLQK LPERERKIIQ LRYGLKDGRY 
RTLEEVGMEF GITRERIRQI EAVALRKLRH PHLGKKLRGY LD