Gene SeHA_C3617 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3617
Symbol	rpoN
ID	6489181
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3499725
End bp	3501158
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	54%
IMG OID	642743737
Product	RNA polymerase factor sigma-54
Protein accession	YP_002047349
Protein GI	194447923
COG category	[K] Transcription
COG ID	[COG1508] DNA-directed RNA polymerase specialized sigma subunit, sigma54 homolog
TIGRFAM ID	[TIGR02395] RNA polymerase sigma-54 factor

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	0.167296
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCAAG GTTTGCAACT CAGGCTTAGC CAACAACTGG CGATGACACC TCAGCTACAA 
CAGGCCATCC GTCTGTTGCA GTTGTCTACG CTGGAACTTC AGCAGGAACT CCAGCAAGCG 
CTGGAAAATA ACCCGCTGCT TGAGCAAACC GATCTTCATG ACGAAATCGA CACTCAGCAA 
CCTCAGGATA ACGATCCTCT CGATACCGCC GACGCGCTCG AACAAAAAGA GATGCCGGAA 
GAGCTGCCGC TTGACGCCAG TTGGGATGAA ATTTACACCG CCGGGACGCC GTCCGGCCCC 
AGCGGCGATT ATATCGACGA TGAGCTGCCC GTCTATCAGG GCGAAACGAC GCAGTCGTTG 
CAGGATTATC TGATGTGGCA GGTTGAGCTA ACGCCCTTCT CGGATACCGA TCGCGCTATT 
GCGACATCCA TTGTCGACGC GGTAGATGAT ACCGGCTATC TCACCGTATC CCTGGACGAA 
ATTCGCGAAA GCATGGGCGA TGTAGAGGTG GATCTCGATG AGGTTGAAGC CGTCCTGAAG 
CGCATTCAGC GTTTTGATCC GGTAGGCGTC GCGGCAAAAG ATCTTCGCGA CTGTCTGCTG 
ATCCAGCTTT CACAATTCGA CAAATCCACG CCGTGGCTGG AAGAGGCGCG GCTTATTATC 
TGCGATCACC TTGATCTGCT GGCCAACCAC GATTTCCGCA CGTTGATGCG CGTTACCCGA 
CTGAAAGAAG AGGTGCTGAA AGAGGCGGTA AACCTGATTC AGTCGCTCGA TCCCAGACCC 
GGTCAATCGA TCCAGACCGG CGAGCCGGAG TACGTTATCC CGGATGTGCT GGTACGCAAG 
CATAACGGTC GCTGGACGGT GGAGCTTAAT GGCGACAGTA TTCCCCGTTT ACAGATTAAC 
CAGCACTATG CCGCCATGTG CAATAGCGCG CGCAACGATG CCGACAGCCA GTTCATCCGC 
AGTAATTTAC AGGATGCGAA ATGGCTGATA AAAAGCCTTG AAAGCCGTAA CGACACGCTG 
CTGCGCGTCA GTCGCTGCAT CGTCGAGCAA CAGCAAGCCT TTTTTGAACA GGGCGAAGAA 
TATATGAAAC CGATGGTACT GGCGGATATC GCCCAGGCCG TCGAGATGCA CGAATCCACT 
ATATCCCGCG TGACCACGCA GAAGTATCTG CACAGCCCGC GCGGTATTTT TGAACTCAAA 
TATTTCTTTT CCAGCCACGT CAATACCGAA GGCGGAGGCG AAGCCTCTTC CACCGCGATT 
CGCGCGCTGG TGAAGAAGTT AATTGCGGCG GAAAACCCCG CGAAACCACT GAGTGACAGC 
AAGTTAACCT CTCTGCTGTC AGAACAGGGT ATCATGGTGG CGCGCCGCAC TGTTGCGAAG 
TACCGAGAGT CTTTATCCAT TCCGCCGTCA AACCAACGCA AACAGCTGGT TTGA

Protein sequence

MKQGLQLRLS QQLAMTPQLQ QAIRLLQLST LELQQELQQA LENNPLLEQT DLHDEIDTQQ 
PQDNDPLDTA DALEQKEMPE ELPLDASWDE IYTAGTPSGP SGDYIDDELP VYQGETTQSL 
QDYLMWQVEL TPFSDTDRAI ATSIVDAVDD TGYLTVSLDE IRESMGDVEV DLDEVEAVLK 
RIQRFDPVGV AAKDLRDCLL IQLSQFDKST PWLEEARLII CDHLDLLANH DFRTLMRVTR 
LKEEVLKEAV NLIQSLDPRP GQSIQTGEPE YVIPDVLVRK HNGRWTVELN GDSIPRLQIN 
QHYAAMCNSA RNDADSQFIR SNLQDAKWLI KSLESRNDTL LRVSRCIVEQ QQAFFEQGEE 
YMKPMVLADI AQAVEMHEST ISRVTTQKYL HSPRGIFELK YFFSSHVNTE GGGEASSTAI 
RALVKKLIAA ENPAKPLSDS KLTSLLSEQG IMVARRTVAK YRESLSIPPS NQRKQLV