Gene CPF_2264 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2264
Symbol	rpoD
ID	4202727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2511938
End bp	2513038
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	32%
IMG OID	638083129
Product	RNA polymerase sigma factor RpoD
Protein accession	YP_696687
Protein GI	110798581
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02393] RNA polymerase sigma factor RpoD, C-terminal domain [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0028881
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCTA AAACAACAAA AGCAAAAAAA GGTGAAGGTA AAGAAAAAGT TGACAAAATG 
GTCTTAGTAA AAAGACTTAT AGATAAAGGT AAAAAAAGCG GTTCATTGAC TTACAAGGAG 
ATAATGGATG AGCTTGATGA AATAGAATTA AACCCAGAAC AAATAGAAAA AATCTATGAG 
GTTCTAGAAT CAATGGGTAT AGAGGTCATA AGTGAAATAG AGCAAGAAGA GGAAGAGGAG 
GAAGAATTAG ATCTTTCTGT TCCAGAAGGT ATTGCTATTG ATGACCCTGT AAGAATGTAC 
TTAAAAGAAA TAGGTAAAGT GCAACTATTA TCATCAGAGG ATGAAATAGA GCTTGCTAAA 
AAAATAGAAG AAGGAAGCAA CTATGCTAAG AAAAAATTAG CAGAGGCTAA CTTAAGACTT 
GTTGTAAGTA TAGCTAAAAG ATATGTTGGT AGAGGAATGT TATTCCTAGA TCTTATACAA 
GAAGGTAACT TAGGTCTTAT AAAGGCTGTT GAAAAATTTG ATTACAGAAA AGGGTATAAG 
TTCTCAACAT ATGCTACATG GTGGATAAGA CAGGCAATAA CTAGAGCTAT TGCTGACCAA 
GCAAGAACTA TAAGAATACC AGTTCATATG GTAGAAACTA TAAATAAACT TATAAGAATA 
CAAAGACAAT TAGTTCAAGA GTTAGGAAGA GATCCATTAC CAGAGGAATT ATCAAAACAA 
ATGGATATGC CAGTAGATAA GGTAAGAGAA ATCTTAAAAA TAGCTCAAGA ACCAGTTTCA 
TTAGAAACTC CAATTGGTGA AGAGGAAGAT TCACATTTAG GTGACTTTAT ACCAGATGAT 
GATGCTCCAG CACCAGCAGA GGCAGCAGCC TTTACAATGT TAAAAGAACA ATTAATAAAT 
GTTTTAGATA CTTTAACTCC TAGAGAGGAA AAAGTATTAA GATTAAGATT TGGATTAGAT 
GATGGAAGAG CTAGAACTCT TGAAGAAGTT GGTAAAGAAT TCAACGTAAC TAGAGAGAGA 
ATTAGACAGA TTGAAGCAAA AGCTTTAAGA AAATTAAGAC ATCCAAGTAG AAGTAAAAAG 
TTAAAAGATT ATTTAGATTA G

Protein sequence

MKAKTTKAKK GEGKEKVDKM VLVKRLIDKG KKSGSLTYKE IMDELDEIEL NPEQIEKIYE 
VLESMGIEVI SEIEQEEEEE EELDLSVPEG IAIDDPVRMY LKEIGKVQLL SSEDEIELAK 
KIEEGSNYAK KKLAEANLRL VVSIAKRYVG RGMLFLDLIQ EGNLGLIKAV EKFDYRKGYK 
FSTYATWWIR QAITRAIADQ ARTIRIPVHM VETINKLIRI QRQLVQELGR DPLPEELSKQ 
MDMPVDKVRE ILKIAQEPVS LETPIGEEED SHLGDFIPDD DAPAPAEAAA FTMLKEQLIN 
VLDTLTPREE KVLRLRFGLD DGRARTLEEV GKEFNVTRER IRQIEAKALR KLRHPSRSKK 
LKDYLD