Gene CPR_0271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_0271
Symbol
ID	4206599
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	329558
End bp	330580
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	29%
IMG OID	642564829
Product	cell envelope-related function transcriptional attenuator
Protein accession	YP_697601
Protein GI	110801829
COG category	[K] Transcription
COG ID	[COG1316] Transcriptional regulator
TIGRFAM ID	[TIGR00350] cell envelope-related function transcriptional attenuator common domain

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.968761
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCAAG GCAAACATGC AAAAAAGAAT GATTCTAATA GTCAAGGTAA TACACCTAAG 
AAAAAAAGTA AAGTGAAAAT AATAGTATTA ACATTATTCT TCTTATTACT TATAGGTATA 
GGACTTGGAG CTACATATGT TTACTCAACA TTAAATAAAA TGGATATAAA GAAAATAGCT 
CAAGATGATA AATCTTTAGG TATTGATGAA TCAAATAAAG ACCTATTCCA AGATGGTATT 
TTAAATATAG CTCTTTTTGG AGTAGATAGC AGAGATCATA ATAATGTTGG ACGCTCTGAT 
TCAATAATAA TAGCTACAAT AGATACTAAA CATGATAAAA TAAAACTTAC ATCTCTTATG 
AGAGATAGTT ATGTTGAAGT TGATGGACAT GGTAAAACTA AATTAACTCA TGCTTATGCT 
TATGGTGGTC CTACTTTAGC ATTAAAAACA ATAAATGAAA ACTTTGGATT AGATATAAAA 
GACTATGTAA CTGTTAACTT TGATAACTTA GCTGAAATAA TAGATGATTT AGGTGGAGTA 
CCAATAAATA TAAAACCTTA TGAAGTTAAG GAAGTTAATA ATTACGCTAA AAATGTTGCA 
GAAATTGCTG GAAGAGAATA TACGCCAGTT AGTGAAGGTG AGCAAGTATT AAATGGTGCC 
CAAGCTGTAG GTTACTCTAG AATTCGTTAT GTTGGTGATG GAGATTATGA AAGAACTGAA 
AGACAAAGAA ATGTTCTTGA TGCAATCATA AAGAAACTTT CAACATTAAA ACCTTCTGAA 
TATCCTGAAA CAATAAAAAA ATTTTTACCT TATGTTGAAA CAAACTTAAC TCCATCTAAA 
ATACTTAGTA TTGCTAAATC AGTTGCTTCA ACTGGTATCC CACCTGTTGA AAATATGCGT 
TTCCCTCTAA ATGGATATTG CAAAGGGGAA ATGATTGATG GTGTTTGGTA TTTAACATTT 
GATGAAGCTA AAACAAAGGA ACAAATACAA AACTATATAT ATAAGGATGT TAATCCAAAA 
TAA

Protein sequence

MSQGKHAKKN DSNSQGNTPK KKSKVKIIVL TLFFLLLIGI GLGATYVYST LNKMDIKKIA 
QDDKSLGIDE SNKDLFQDGI LNIALFGVDS RDHNNVGRSD SIIIATIDTK HDKIKLTSLM 
RDSYVEVDGH GKTKLTHAYA YGGPTLALKT INENFGLDIK DYVTVNFDNL AEIIDDLGGV 
PINIKPYEVK EVNNYAKNVA EIAGREYTPV SEGEQVLNGA QAVGYSRIRY VGDGDYERTE 
RQRNVLDAII KKLSTLKPSE YPETIKKFLP YVETNLTPSK ILSIAKSVAS TGIPPVENMR 
FPLNGYCKGE MIDGVWYLTF DEAKTKEQIQ NYIYKDVNPK