Gene SeD_A3567 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3567
Symbol	rpoD
ID	6871473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3423448
End bp	3425295
Gene Length	1848 bp
Protein Length	615 aa
Translation table	11
GC content	53%
IMG OID	642786555
Product	RNA polymerase sigma factor RpoD
Protein accession	YP_002217192
Protein GI	198242489
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02393] RNA polymerase sigma factor RpoD, C-terminal domain [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.942992
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	0.234837
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCAAA ACCCGCAGTC ACAGCTGAAA CTTCTTGTCA CCCGTGGTAA GGAGCAAGGC 
TATCTGACCT ATGCTGAGGT CAATGACCAT CTGCCGGAAG ATATCGTCGA TTCAGATCAA 
ATTGAAGATA TCATCCAAAT GATCAACGAC ATGGGTATTC AGGTAATGGA AGAAGCGCCT 
GATGCCGATG ATCTGCTGCT GGCTGAAAAT ACCACCAGCA CCGATGAAGA TGCGGAAGAA 
GCTGCTGCAC AAGTTCTGTC CAGTGTTGAG TCTGAAATCG GTCGTACGAC TGACCCGGTA 
CGCATGTATA TGCGTGAAAT GGGCACTGTT GAACTGTTGA CCCGGGAAGG CGAAATCGAC 
ATCGCTAAAC GTATCGAAGA CGGGATCAAC CAGGTTCAAT GCTCCGTTGC CGAATACCCG 
GAAGCCATTA CCTATCTGCT GGAACAGTAC GATCGCGTTG AGGCTGAAGA GGCTCGTTTG 
TCCGATCTTA TCACCGGCTT TGTCGATCCG AACGCGGAAG AAGAGATGGC GCCGACCGCA 
ACTCACGTCG GTTCTGAACT CTCCCAGGAA GACCTGGATG ATGACGAAGA CGAAGATGAA 
GAAGACGGCG ACGATGACGC CGCCGATGAC GACAACAGCA TTGACCCTGA ACTGGCACGC 
GAAAAATTCG CTGAGCTGCG CGCGCAATAC GTCGTTACGC GCGACACCAT CAAAGCGAAA 
GGCCGCAGCC ATGCTGCCGC GCAGGAAGAG ATTCTGAAGC TGTCTGAAGT GTTCAAACAG 
TTCCGTCTGG TACCGAAGCA ATTCGACTAT CTGGTCAACA GTATGCGCGT GATGATGGAT 
CGCGTGCGTA CCCAGGAACG TCTGATCATG AAGCTCTGCG TCGAGCAGTG CAAAATGCCG 
AAGAAGAACT TTATCACGCT GTTTACCGGT AACGAAACCA GCGAAACCTG GTTCAACGCC 
GCTATCGCGA TGAACAAACC GTGGTCGGAA AAACTGCACG ATGTCGCGGA AGAAGTGCAA 
CGCTGTCTGC AAAAACTGCG GCAGATTGAA GAAGAGACCG GTCTGACCAT CGAACAGGTG 
AAAGACATCA ACCGTCGAAT GTCCATCGGG GAAGCGAAAG CCCGCCGTGC GAAGAAAGAG 
ATGGTTGAAG CGAACTTACG TCTGGTTATT TCTATCGCTA AGAAATACAC CAACCGTGGC 
TTGCAGTTCC TTGATCTGAT TCAGGAAGGC AACATCGGTC TGATGAAAGC GGTAGATAAG 
TTTGAATACC GTCGCGGCTA CAAGTTCTCC ACCTATGCAA CCTGGTGGAT CCGTCAGGCG 
ATCACCCGTT CTATCGCCGA TCAGGCGCGC ACCATCCGTA TTCCGGTGCA TATGATTGAG 
ACCATCAACA AGCTCAACCG TATTTCTCGC CAGATGCTGC AAGAGATGGG CCGCGAGCCA 
ACGCCGGAAG AGCTGGCTGA ACGGATGCTG ATGCCGGAAG ATAAAATTCG TAAGGTGCTG 
AAGATTGCCA AAGAGCCAAT CTCCATGGAA ACGCCGATCG GCGACGATGA AGATTCGCAT 
CTGGGTGATT TCATCGAGGA TACCACCCTC GAGCTGCCGC TGGACTCTGC CACTACCGAG 
AGCCTGCGTG CCGCCACTCA CGACGTTTTG GCTGGCCTGA CCGCTCGTGA AGCGAAAGTG 
CTGCGTATGC GTTTCGGTAT CGATATGAAC ACCGACCACA CGCTGGAAGA AGTGGGTAAA 
CAGTTCGATG TTACCCGCGA ACGTATCCGT CAGATCGAAG CGAAGGCGCT GCGTAAACTG 
CGCCACCCGA GCCGTTCTGA AGTGCTGCGC AGCTTCCTCG ACGATTAA

Protein sequence

MEQNPQSQLK LLVTRGKEQG YLTYAEVNDH LPEDIVDSDQ IEDIIQMIND MGIQVMEEAP 
DADDLLLAEN TTSTDEDAEE AAAQVLSSVE SEIGRTTDPV RMYMREMGTV ELLTREGEID 
IAKRIEDGIN QVQCSVAEYP EAITYLLEQY DRVEAEEARL SDLITGFVDP NAEEEMAPTA 
THVGSELSQE DLDDDEDEDE EDGDDDAADD DNSIDPELAR EKFAELRAQY VVTRDTIKAK 
GRSHAAAQEE ILKLSEVFKQ FRLVPKQFDY LVNSMRVMMD RVRTQERLIM KLCVEQCKMP 
KKNFITLFTG NETSETWFNA AIAMNKPWSE KLHDVAEEVQ RCLQKLRQIE EETGLTIEQV 
KDINRRMSIG EAKARRAKKE MVEANLRLVI SIAKKYTNRG LQFLDLIQEG NIGLMKAVDK 
FEYRRGYKFS TYATWWIRQA ITRSIADQAR TIRIPVHMIE TINKLNRISR QMLQEMGREP 
TPEELAERML MPEDKIRKVL KIAKEPISME TPIGDDEDSH LGDFIEDTTL ELPLDSATTE 
SLRAATHDVL AGLTAREAKV LRMRFGIDMN TDHTLEEVGK QFDVTRERIR QIEAKALRKL 
RHPSRSEVLR SFLDD