Gene CPF_1111 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1111
Symbol
ID	4202865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1267397
End bp	1268917
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	25%
IMG OID	638081992
Product	AraC family transcriptional regulator
Protein accession	YP_695557
Protein GI	110801096
COG category	[T] Signal transduction mechanisms
COG ID	[COG4753] Response regulator containing CheY-like receiver domain and AraC-type DNA-binding domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000128485
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAAAAA TACTATTAGT AGATGATGAG GCTACAGAAC GTGAAGGAAT TGAATTTCTT 
ATAAAAAGAT ATGAATTTCC TTTGAATATA GCTAAAGCTG TAAATGGAAA AGAAGCTTTA 
GAATACATAA AGAAAAATCA TATAGATATT CTTTTTACAG ATGTAAAAAT GCCTTTCTTG 
GATGGACTAG AATTAGCAAA GGAAACCTTT AAGTATGATC CTAAAATTAG AATAATAATT 
TTTAGTGCAT ATAGTGAATT TGACTATGCT AAAAAAGCCT TAGAGGCAAA AGTGGTTGAT 
TATTTACTTA AACCTATTGA GGTGGATGAA TTTAAAAGAG TTATGGAAGA GGTAATAAAA 
AGCTGCATAA AAAGAAAGGA AGAAGAGAAA GAAAAAGAAT TACTTATGGA ATCAAGCAAG 
AAGATGTTAC TTTATAAGCT ATTAGCTAAT CACAACAACC AAAATGATAT TAATGAAAAG 
TTAAACGTAT ACAATATACA GTTGAAAGAT AAATATTTAG TATTAATAAA CATAGAGACA 
AGAGATAACT TTTTTGAGGA GAAGGAGGAG ATTTTCTTTA ATCTCTTAAA TACATATTTA 
AAAATTCCAT ATGAATATAT AAATTTTTAT CCTAATGAAT CATATTTATT ATTGCATAGC 
AATTTAAAAA TAAAAGAGGA TTTTTTAGAA GAAGTTTGTT TTAAATTAGC CAGAGAAATT 
AAATTATTAG CCAATGAAAA CTCTTCTTTT TTTATTAGTA ATGTATTTTG TGGAATTGAA 
AAAATCTATG ATAAGGTAAA GGGATTAAAT AATATAAAGG AAAATATTTA TGATTTTGAA 
TCAAGGATTA TTAGGGTTAA TAAGGATAAA ACTAATGATT TATACACACT TGAAATAGAG 
AATGTAAAGG AAAATCTTAA AAACTCTATA AATGAAAGAA ATTTAAATGA TATTGAATTT 
TACATAAATA AGCTTATAGA ATACATGTTA GAATCAGGTT CACTTAGTAC TATATACATA 
CATCACCTTT TTTATGATTT AATGGAAAAA CTTTGTAAAG CCTTTGATAT ATATAATGGT 
GAAGTGAAAA AGAGATTTAT AGAAAAGATA TTAAAATGTA ACTCAAGTGA AACCTTAAAA 
GCAGCTTTTG AATCTATTAT AAAGGATATT GCAAAGGAAT GTGATAATGA TATTTTAGAC 
GAAAAAAGCA TAGCTAACAA AGTGATAAAG ATAATAAAAA ATGAATATAG CAGTGAACTG 
AGTTTAGATT ATATTGCAGA TAAGGTTAAT TTTACGCCAA CCTATTTAAG CTATGTTTTT 
AAGAAAGAAA CAGGCTCAAA CATAGTTAAA TATATAACTG ATTTTAGAAT GAATAAGGCT 
AAGGAGTTTT TAGAAGAAGG TAATATGAAA ATTGTACAAG TTGGTAAGGC CTGTGGATAT 
GAAAATCAAT CATACTTTAA CCGTATATTT AAGAATTATT TTGGAGTAAC TCCAAATCAA 
TTTAAACGTA AGAATAGTTA A

Protein sequence

MLKILLVDDE ATEREGIEFL IKRYEFPLNI AKAVNGKEAL EYIKKNHIDI LFTDVKMPFL 
DGLELAKETF KYDPKIRIII FSAYSEFDYA KKALEAKVVD YLLKPIEVDE FKRVMEEVIK 
SCIKRKEEEK EKELLMESSK KMLLYKLLAN HNNQNDINEK LNVYNIQLKD KYLVLINIET 
RDNFFEEKEE IFFNLLNTYL KIPYEYINFY PNESYLLLHS NLKIKEDFLE EVCFKLAREI 
KLLANENSSF FISNVFCGIE KIYDKVKGLN NIKENIYDFE SRIIRVNKDK TNDLYTLEIE 
NVKENLKNSI NERNLNDIEF YINKLIEYML ESGSLSTIYI HHLFYDLMEK LCKAFDIYNG 
EVKKRFIEKI LKCNSSETLK AAFESIIKDI AKECDNDILD EKSIANKVIK IIKNEYSSEL 
SLDYIADKVN FTPTYLSYVF KKETGSNIVK YITDFRMNKA KEFLEEGNMK IVQVGKACGY 
ENQSYFNRIF KNYFGVTPNQ FKRKNS