Gene CPF_0156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0156
Symbol
ID	4203419
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	184140
End bp	185642
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	30%
IMG OID	638081037
Product	perfringolysin O
Protein accession	YP_694620
Protein GI	110798884
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.772662
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAAGAT TTAAGAAAAC AAAATTAATA GCAAGTATTG CAATGGCTTT ATGTCTGTTT 
TCTCAACCAG TAATCAGTTT CTCAAAGGAT ATAACAGATA AAAATCAAAG TATTGATTCT 
GGAATATCAA GTTTAAGTTA CAATAGAAAT GAAGTTTTAG CTAGTAATGG AGATAAAATT 
GAAAGCTTTG TTCCAAAGGA AGGTAAAAAA GCTGGTAATA AATTTATAGT TGTAGAACGT 
CAAAAAAGAT CCCTTACAAC ATCACCAGTA GATATATCAA TAATTGATTC TGTAAATGAC 
CGTACATATC CAGGAGCATT ACAACTTGCA GATAAAGCAT TTGTGGAAAA TAGACCTACA 
ATCTTAATGG TAAAAAGAAA GCCTATTAAC ATTAATATAG ATTTACCAGG ATTAAAGGGC 
GAAAATAGTA TAAAGGTTGA TGATCCAACC TATGGAAAAG TTTCTGGAGC AATTGATGAA 
TTAGTATCTA AGTGGAATGA AAAGTATTCA TCTACACATA CTTTACCAGC AAGAACTCAA 
TATTCAGAAT CTATGGTTTA TAGTAAATCA CAAATATCAA GTGCCCTTAA TGTTAATGCT 
AAAGTCCTTG AAAACTCACT TGGAGTAGAC TTTAATGCAG TAGCAAACAA TGAGAAAAAA 
GTTATGATTT TAGCATATAA ACAAATATTC TATACAGTAA GTGCAGATTT ACCTAAGAAT 
CCATCAGATC TTTTTGATGA CAGTGTTACA TTTAATGATT TAAAACAAAA GGGAGTAAGT 
AATGAAGCAC CTCCACTTAT GGTTTCAAAT GTAGCTTATG GAAGAACAAT ATATGTTAAG 
TTAGAAACTA CTTCTAGTAG TAAAGATGTA CAAGCTGCTT TCAAAGCTCT TATAAAGAAC 
ACTGATATAA AAAATAGTCA ACAATATAAA GATATTTATG AAAATAGTTC CTTCACAGCA 
GTAGTTTTAG GAGGAGATGC ACAAGAACAT AACAAAGTTG TAACTAAAGA CTTTGATGAA 
ATAAGAAAAG TAATTAAAGA CAATGCAACT TTTAGTACAA AAAACCCAGC ATATCCAATA 
TCTTATACTA GTGTTTTCTT AAAAGATAAC TCAGTTGCTG CTGTTCACAA TAAAACAGAT 
TATATAGAAA CAACTTCTAC AGAGTATTCT AAGGGAAAAA TAAACTTAGA TCATAGTGGA 
GCCTATGTTG CACAGTTTGA AGTAGCCTGG GATGAAGTTT CATATGACAA AGAAGGAAAT 
GAAGTTTTAA CTCATAAAAC ATGGGATGGA AATTATCAAG ATAAAACAGC TCACTATTCA 
ACAGTAATAC CTCTTGAAGC TAATGCAAGA AATATAAGAA TAAAAGCAAG AGAGTGTACA 
GGCCTTGCTT GGGAATGGTG GAGAGATGTT ATAAGTGAAT ATGATGTTCC ATTAACAAAT 
AATATAAATG TTTCAATATG GGGAACAACT TTATACCCTG GATCTAGTAT TACTTACAAT 
TAA

Protein sequence

MIRFKKTKLI ASIAMALCLF SQPVISFSKD ITDKNQSIDS GISSLSYNRN EVLASNGDKI 
ESFVPKEGKK AGNKFIVVER QKRSLTTSPV DISIIDSVND RTYPGALQLA DKAFVENRPT 
ILMVKRKPIN INIDLPGLKG ENSIKVDDPT YGKVSGAIDE LVSKWNEKYS STHTLPARTQ 
YSESMVYSKS QISSALNVNA KVLENSLGVD FNAVANNEKK VMILAYKQIF YTVSADLPKN 
PSDLFDDSVT FNDLKQKGVS NEAPPLMVSN VAYGRTIYVK LETTSSSKDV QAAFKALIKN 
TDIKNSQQYK DIYENSSFTA VVLGGDAQEH NKVVTKDFDE IRKVIKDNAT FSTKNPAYPI 
SYTSVFLKDN SVAAVHNKTD YIETTSTEYS KGKINLDHSG AYVAQFEVAW DEVSYDKEGN 
EVLTHKTWDG NYQDKTAHYS TVIPLEANAR NIRIKARECT GLAWEWWRDV ISEYDVPLTN 
NINVSIWGTT LYPGSSITYN