Gene CPR_1303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1303
Symbol	rpoN
ID	4205088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1473975
End bp	1475360
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	28%
IMG OID	642565859
Product	RNA polymerase factor sigma-54
Protein accession	YP_698625
Protein GI	110803124
COG category	[K] Transcription
COG ID	[COG1508] DNA-directed RNA polymerase specialized sigma subunit, sigma54 homolog
TIGRFAM ID	[TIGR02395] RNA polymerase sigma-54 factor

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.357078
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAATGG ATTTTAATTT GAATTTAACT CAAGAGCAAA AGCTTATTAT GACCCAGCAA 
ATGCAACTTT CAATAAAACT TTTACAAATG TCAACATATG ATTTAAGAGA ATATATTGAA 
AAAGAATTTT CAGAAAATCC TGTATTAGAA GCTCAGTATG AGGGTACTAA AGAGGTGTCA 
AAAGAGCAAG ATAGATTAGA ATATAAAGAG TTATTAAAAT ACTTAGAGTC AGATAATTAT 
GGTTCTCAAA GTTATGGTGA ATATGATGAT GAAGAAATAT CACCTTTTAC TTTCATAAGT 
AAGCCAGAAT CTTTAACAGA TTATTTAGAA GGGCAAATAT TAGAACTACC CATAGACGAA 
TATATGAGAA GTGTATGTAG TTATATGGTT GAGTGTTTAG ATCAAAAGGG ATATTTAGAT 
ATAAAAAAAG AAGAATTAAT TAATGAGCTA GATTGTTCTG AAGAGACTTT TAATAGGGCT 
TTAATAGTTA TTCAAAACTT AGAACCTGCT GGTATAGGAG CAAGAGATTT AAAGGAATGC 
TTAGAAATTC AGTTAGAAAG AAAAGGTGAA AATGACCCTA TAGTTAAAGA GATTATATAT 
AATCATTTAG ATGATTTAGC AGATAATAAA TATCAAGTTA TTGCAAAGGA TTTAGGAATT 
ACTCCTAAAA AAGCACAAGA TTATGGAGAT TTGATAAAAA CTTTAGAACC AAAACCATCA 
AGAGGCTTTT ACACTGGTGA CGAAGTAGGG TTTATAATTC CTGATGCAGA AATACGAAAG 
ATAGATGGAG AATTCCTCAT ATTAATGAAT GATGGAGTTT TACCTATGCT TTCAGTTAAT 
CCTTTATATA AAGCTATATT AAAAGATAGT ACTAATGATA AAGAGGCTAC AGAGTATGTA 
AAGGAAAAAA TAGAAAAAGC TATGTTTTTA ATTAAAAGTA TAGAGCAAAG AAAAAGTACT 
TTATACAAAG TTCTGCAAAA AATACTTGAA AAGCAAAAGG ATTATTTTGA AAAGGGAGAG 
AAATATTTAA AGCCTATGAC TTTAAAAGAA ATAGCTGAGA AACTAGAAAT GCATGAATCA 
ACTATTTCAA GAGCTATAAG AGATAAGTAT ATTTTAACTT CTATGGGAAC AATAAAAATA 
AAGAATCTCT TTGTAAACTC AATAAGTAAT AAAGAAAAAA GTCATGGAGA AGAAGATGTT 
ACAGTTATAA ATATAAAAAA AGCTTTAGAA GAAGTAATTA AGAAAGAGGA TAAAAGGAAG 
CCCTTATCAG ATCAAGCCAT AAGCGAAATT TTAAAAGAAA AAGGAATGGT TATTTCAAGA 
AGAACTGTGG CAAAATACAG AGAAGAGTTA GGCATAAAGT CATCTAGCAA GAGAAAAAGA 
TTTTAA

Protein sequence

MLMDFNLNLT QEQKLIMTQQ MQLSIKLLQM STYDLREYIE KEFSENPVLE AQYEGTKEVS 
KEQDRLEYKE LLKYLESDNY GSQSYGEYDD EEISPFTFIS KPESLTDYLE GQILELPIDE 
YMRSVCSYMV ECLDQKGYLD IKKEELINEL DCSEETFNRA LIVIQNLEPA GIGARDLKEC 
LEIQLERKGE NDPIVKEIIY NHLDDLADNK YQVIAKDLGI TPKKAQDYGD LIKTLEPKPS 
RGFYTGDEVG FIIPDAEIRK IDGEFLILMN DGVLPMLSVN PLYKAILKDS TNDKEATEYV 
KEKIEKAMFL IKSIEQRKST LYKVLQKILE KQKDYFEKGE KYLKPMTLKE IAEKLEMHES 
TISRAIRDKY ILTSMGTIKI KNLFVNSISN KEKSHGEEDV TVINIKKALE EVIKKEDKRK 
PLSDQAISEI LKEKGMVISR RTVAKYREEL GIKSSSKRKR F