Gene Rcas_4348 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4348
Symbol
ID	5541861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5599697
End bp	5600896
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	58%
IMG OID	640896454
Product	RpoD family RNA polymerase sigma factor
Protein accession	YP_001434390
Protein GI	156744261
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02393] RNA polymerase sigma factor RpoD, C-terminal domain [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.866985
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGAAG GCAGATCCAT GACCACCGAG ATCGTGGAGC AGACACGGCA GGCGTGGGCG 
CAAACGCTCG AATACCTCCT CGACATTGGG CGCACACGCG GGTTCCTCAC CTATAACGAA 
ATTCTTGAAG CGCTTCCCCA ACCCGAATAT CACGTTGCCG ATGTTGATCA ATTGTACGCT 
TCATTGCAGG CGGAAGGCAT TCGGGTGGTC GAGACCCCGC TCGATATGAG CGACCACGGC 
GCGGTCGGCG ATGATGAATT GCTGGCGGAA ATGCCGGACC TGACCGATGT GGCGCTCGAT 
GATCCGGTTC GGATGTATTT ACAGGAGATT GGTCAGGTGC CATTGTTGTC GGCAGAGCAG 
GAAGTGATGC TGGCAAAGGC GATGGAGGCC GGGCATCGCG CCCGGCGCGC GCTTGAGTGC 
GAGGAGTATA GCTCCTGGCA GGAACGGATG ATGTACGAAC AGCAGGTTGC ACAGGGGAAT 
GAAGCGCGTC AGCACCTGAT CCAGGCCAAT CTGCGTCTGG TCGTCTCGAT CGCCAAAAAA 
TATACGTCGT ATGGTCTGAC GATGATGGAC CTGGTGCAGG AAGGCAATAT CGGACTTATG 
CGTGCAGTCG AAAAGTTCGA CTATACCAAG GGGCACAAGT TCTCTACCTA CGCCACCTGG 
TGGATTCGCC AGGCGATCAC GCGCGCCATC GCCGATCAAA GCCGCACCAT CCGCCTGCCG 
GTGCATATGG GTGAGGCGAT TAGTCAGGTC AAGCGCGCCT CGCATAAACT TCAGCAGATG 
ATGCAGCGCG AACCGACACC GGAAGAGATC GCCGATGCGA TGGGCATCAG TTCGACGAAG 
GTGCGTCGCA CGCTCGAAGC CTCGATGCAC CCGCTATCGC TGGAAATGCC GGTTGGGCAG 
GAAGGCGAGG GCCGTATGGG CGACTTTATC GAAGATGATC GTATCTCGAC CCCGGCTGAA 
GCTGCAGCTG CATCGATGCT GCGCGAGCAA CTCGAAGAGG TGCTGCAAAA ACTCCCTGAA 
CGGGAACGGA AGATTATTCA GTTGCGCTAT GGGCTGAAGG ATGGTCGTTA CCGCACACTG 
GAAGAAGTCG GTATGGAATT TGGCATCACC CGCGAGCGCA TCCGGCAGAT CGAAGCCGTG 
GCGCTGCGGA AATTGCGCCA TCCCCACCTT GGCAAGAAGT TGCGCGGTTA CCTCGATTGA

Protein sequence

MQEGRSMTTE IVEQTRQAWA QTLEYLLDIG RTRGFLTYNE ILEALPQPEY HVADVDQLYA 
SLQAEGIRVV ETPLDMSDHG AVGDDELLAE MPDLTDVALD DPVRMYLQEI GQVPLLSAEQ 
EVMLAKAMEA GHRARRALEC EEYSSWQERM MYEQQVAQGN EARQHLIQAN LRLVVSIAKK 
YTSYGLTMMD LVQEGNIGLM RAVEKFDYTK GHKFSTYATW WIRQAITRAI ADQSRTIRLP 
VHMGEAISQV KRASHKLQQM MQREPTPEEI ADAMGISSTK VRRTLEASMH PLSLEMPVGQ 
EGEGRMGDFI EDDRISTPAE AAAASMLREQ LEEVLQKLPE RERKIIQLRY GLKDGRYRTL 
EEVGMEFGIT RERIRQIEAV ALRKLRHPHL GKKLRGYLD