Gene BCZK4042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCZK4042
Symbol	sigA
ID	3026972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus E33L
Kingdom	Bacteria
Replicon accession	NC_006274
Strand	-
Start bp	4150370
End bp	4151491
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	39%
IMG OID	637548256
Product	RNA polymerase sigma factor RpoD
Protein accession	YP_085621
Protein GI	52141207
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02393] RNA polymerase sigma factor RpoD, C-terminal domain [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000102439
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGACA AACCAGCTCG TTCTAAACAA ATTGAAACTG AAATGACCCT TGAGCAAGTG 
AAAGAACAAC TCACTGAGCT CGGAAAAAAA CGTGGCGTTC TTACATATGA AGAGATTGCA 
GAACGCATGA ATGGATTTGA AATTGAATCC GATCAAATGG ATGAATACTA TGAATATTTA 
GGTGAACAAG GGATTGACTT AGTTGGCGAC AACGATGAAG GCCCTAATAA TCACCAAATT 
ACAAAAACAG AAGAAGAGTT TGACCTGAAT GACTTAAGTG TACCACCAGG GGTTAAAATC 
AACGATCCTG TTCGTATGTA TTTAAAAGAA ATTGGTCGTG TAGATTTACT ATCTGCAGAA 
GAAGAAATTC GACTTGCAAC GCGTATTGAA GAAGGCGATG AAGAAGCAAA ACGTCGTCTT 
GCAGAAGCAA ACTTACGTCT TGTAGTAAGT ATTGCAAAGC GCTATGTAGG CCGCGGTATG 
CTTTTCTTAG ACTTAATCCA AGAAGGGAAT ATGGGTCTAA TTAAAGCGGT TGAAAAGTTC 
GATTATCGTA AAGGTTTCAA ATTTAGTACG TATGCAACTT GGTGGATTCG CCAAGCAATT 
ACACGTGCGA TTGCAGACCA AGCAAGAACA ATTCGTATCC CAGTTCATAT GGTTGAAACG 
ATTAATAAGT TAATTCGTGT ACAACGTCAA TTATTACAAG ATTTAGGACG TGAACCATCT 
CCTGAAGAGA TTGGTGAAGA AATGGATCTT GCTCCAGAAA AAGTGCGCGA AATCTTAAAA 
ATTGCTCAGG AGCCAGTCTC TCTTGAAACA CCGATTGGTG AAGAAGATGA CTCCCATTTA 
GGTGATTTTA TTGAAGACCA AGAAGCAACA TCGCCTGCGG ACCATGCAGC GTATGAATTG 
CTAAAAGAAC AATTAGAAGA TGTGTTAGAT ACACTAACAG ATCGTGAAGA AAATGTTCTA 
CGTCTTCGTT TTGGTTTAGA TGATGGACGA ACTCGTACGC TTGAAGAAGT TGGGAAAGTA 
TTCGGCGTAA CGAGAGAACG TATTCGTCAA ATTGAAGCAA AAGCACTTCG TAAATTGAGA 
CATCCTAGCC GTAGTAAGCG TCTTAAGGAT TTCTTAGAAT AG

Protein sequence

MADKPARSKQ IETEMTLEQV KEQLTELGKK RGVLTYEEIA ERMNGFEIES DQMDEYYEYL 
GEQGIDLVGD NDEGPNNHQI TKTEEEFDLN DLSVPPGVKI NDPVRMYLKE IGRVDLLSAE 
EEIRLATRIE EGDEEAKRRL AEANLRLVVS IAKRYVGRGM LFLDLIQEGN MGLIKAVEKF 
DYRKGFKFST YATWWIRQAI TRAIADQART IRIPVHMVET INKLIRVQRQ LLQDLGREPS 
PEEIGEEMDL APEKVREILK IAQEPVSLET PIGEEDDSHL GDFIEDQEAT SPADHAAYEL 
LKEQLEDVLD TLTDREENVL RLRFGLDDGR TRTLEEVGKV FGVTRERIRQ IEAKALRKLR 
HPSRSKRLKD FLE