Gene EcHS_A2879 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2879
Symbol	rpoS
ID	5591682
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2883978
End bp	2884970
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	52%
IMG OID	640921996
Product	RNA polymerase sigma factor RpoS
Protein accession	YP_001459507
Protein GI	157162189
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02394] RNA polymerase sigma factor RpoS [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCAGA ATACGCTGAA AGTTCATGAT TTAAATGAAG ATGCGGAATT TGATGAGAAC 
GGAGTTGAGG TTTTTGACGA AAAGGCCTTA GTAGAAGAGG AACCCAGTGA TAACGATTTG 
GCCGAAGAGG AACTGTTATC GCAGGGAGCC ACACAGCGTG TGTTGGACGC GACTCAGCTT 
TACCTTGGTG AGATTGGTTA TTCACCACTG TTAACGGCCG AAGAAGAAGT TTATTTTGCG 
CGTCGCGCAC TGCGTGGAGA TGTCGCCTCT CGCCGCCGGA TGATCGAGAG TAACTTGCGT 
CTGGTGGTAA AAATTGCCCG CCGTTATGGC AATCGTGGTC TGGCGTTGCT GGACCTTATC 
GAAGAGGGCA ACCTGGGGCT GATCCGCGCG GTAGAGAAGT TTGACCCGGA ACGTGGTTTC 
CGCTTCTCAA CATACGCAAC CTGGTGGATT CGCCAGACGA TTGAACGGGC GATTATGAAC 
CAAACCCGTA CTATTCGTTT GCCGATTCAC ATCGTAAAGG AGCTGAACGT TTACCTGCGA 
ACCGCACGTG AGTTGTCCCA TAAGCTGGAC CATGAACCAA GTGCGGAAGA GATCGCAGAG 
CAACTGGATA AGCCAGTTGA TGACGTCAGC CGTATGCTTC GTCTTAACGA GCGCATTACC 
TCGGTAGACA CCCCGCTGGG TGGTGATTCC GAAAAAGCGT TGCTGGACAT CCTGGCCGAT 
GAAAAAGAGA ACGGTCCGGA AGATACCACG CAAGATGACG ATATGAAGCA GAGCATCGTC 
AAATGGCTGT TCGAGCTGAA CGCCAAACAG CGTGAAGTGC TGGCACGTCG ATTCGGTTTG 
CTGGGGTACG AAGCGGCAAC ACTGGAAGAT GTAGGTCGTG AAATTGGCCT CACCCGTGAA 
CGTGTTCGCC AGATTCAGGT TGAAGGCCTG CGCCGTTTGC GTGAAATCCT GCAAACGCAG 
GGGCTGAATA TCGAAGCGCT GTTCCGCGAG TAA

Protein sequence

MSQNTLKVHD LNEDAEFDEN GVEVFDEKAL VEEEPSDNDL AEEELLSQGA TQRVLDATQL 
YLGEIGYSPL LTAEEEVYFA RRALRGDVAS RRRMIESNLR LVVKIARRYG NRGLALLDLI 
EEGNLGLIRA VEKFDPERGF RFSTYATWWI RQTIERAIMN QTRTIRLPIH IVKELNVYLR 
TARELSHKLD HEPSAEEIAE QLDKPVDDVS RMLRLNERIT SVDTPLGGDS EKALLDILAD 
EKENGPEDTT QDDDMKQSIV KWLFELNAKQ REVLARRFGL LGYEAATLED VGREIGLTRE 
RVRQIQVEGL RRLREILQTQ GLNIEALFRE