Gene CPF_2839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2839
Symbol
ID	4200953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	3102687
End bp	3104309
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	29%
IMG OID	638083706
Product	hypothetical protein
Protein accession	YP_697203
Protein GI	110798752
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCACATA ATAAATCATA TAGAACTTTT ATAATATTAC AAGAAGATGA AAAGGGGCAT 
TCTATGGCTT CAGATAAGCC TTTAACTGGA TATGCCAAGA TAGAAACTAA GAATGATAAA 
TGTAAAGTTT CTTTTTACGC TCAAAACTTA AAGAAAGAAT ACAAAGATTG TTATATGATG 
CTTATTTGTA ACAAGAAAGA TTTTAAGAAG AATATAAATC TTGGTCCAAT GAACATAAAT 
CAACAAGGAA AGGCAGAAAT GAGTTTAGAA TATGATTCTA TCAACATAGG AGATTTAAAT 
GTATCTTATG AGAATATAGT AGGAGCTGCT ATAGGAAAAA ATATTAATGG TAGAACAGTA 
TTCTTTATGT GTGGATTTTT AAATAACCAA ATGCCAAAGG ATAATTGGAA AAATTATGAG 
ATTAAGATGA TATCAGGCAA AGAAAAGTCT CATTACGATA AAAATAATAA AGAAGACGAA 
ATGAAAAAAG AATGTCCTAT TAACATGAAA GAGCATAAGG AAAAATATAA TGATGATAAA 
GATTATTATA AGGACAAGAA AGACAAAGAT GAAAAAGATA AGTATAAAGA GTATCTAAAA 
GAAAAGGACA AGGATTATTT AAAAGAAGAG AATAAAGAAA AGGAATGTAA AAAAGAATAT 
TGTAAGGATA CAGAAGATAA AGAGGATAAA GATGATTGCA AAGAGCATTT AAAAGAAGAA 
TATAAAGAGA AAAAAGATGA CTGTAGAGGA AAAGACAAAG AAGAGTGCAA GCACCATGAT 
AAAGAAGAGA AGCATGAGGA AAAATGTGAA GAGGATAAAA AATATAAAGA TGATAAAGAG 
GACAAATATA AGAAAGAAGA TAAATATAAG GATAAATATG AAGTAGATGA TGATTGTAAA 
GATAAACATG AAGAGCATAA AGAATATAAG GATAAAGATA CGGATAAAGA TAATCATGAA 
GAAAAGAAAA TAGAAGGTTA TAAAGACTGC TATAAGGAAA AATATCACCG CAATGATAAT 
TGGGATTATA GATCAAAATT ACAAGAGTGT GATAGATTTA TAAGTAAAAT AGATTTAGAA 
AGAGAATATG ATCCTTATGA TGGAGAACGT TATGAGCTAG GTAGAAGATT TGCAGAGTAC 
GAAAATGAAA TAGAGCAAAT GAAACTTAGA GATTGTAAGG AGAAAGAAGA AAAAACTTAT 
GAAGTTGACT TTGATTGTCC TATAGGTGAA GTTTTAATGG GAGCTTTAGA AGGATGTAAG 
AAGGTTCCTA AATTTGCAGA GGATATAAAA AGATGTGCAT GGTATAAGGT TGATGTTAGA 
AACTTCGATG ATATGTGTAA TATGTCAAAC TATAATAAAT ACACAATGAT GTATTATCCT 
ATGATTAATT ACTATCCTTA TATAAGCAAA GAAGGTCATT TCTTCTTTGG TGTAAAGTGT 
GATAAGGATG GAGATATAAA ATATATTTTA TATGCTATTC CAGGAACTAA GGATAGAAAA 
GATCAACCAT ACGGTGGTAG AACTGGTTTC GTTACATGGG ACAGATATGG AGATAGAGAA 
AATGGCTATT GGATAATGTT CTATGATTTT GAAAACTCAT CTGTAGTTAT CCCTATGAAA 
TAA

Protein sequence

MAHNKSYRTF IILQEDEKGH SMASDKPLTG YAKIETKNDK CKVSFYAQNL KKEYKDCYMM 
LICNKKDFKK NINLGPMNIN QQGKAEMSLE YDSINIGDLN VSYENIVGAA IGKNINGRTV 
FFMCGFLNNQ MPKDNWKNYE IKMISGKEKS HYDKNNKEDE MKKECPINMK EHKEKYNDDK 
DYYKDKKDKD EKDKYKEYLK EKDKDYLKEE NKEKECKKEY CKDTEDKEDK DDCKEHLKEE 
YKEKKDDCRG KDKEECKHHD KEEKHEEKCE EDKKYKDDKE DKYKKEDKYK DKYEVDDDCK 
DKHEEHKEYK DKDTDKDNHE EKKIEGYKDC YKEKYHRNDN WDYRSKLQEC DRFISKIDLE 
REYDPYDGER YELGRRFAEY ENEIEQMKLR DCKEKEEKTY EVDFDCPIGE VLMGALEGCK 
KVPKFAEDIK RCAWYKVDVR NFDDMCNMSN YNKYTMMYYP MINYYPYISK EGHFFFGVKC 
DKDGDIKYIL YAIPGTKDRK DQPYGGRTGF VTWDRYGDRE NGYWIMFYDF ENSSVVIPMK