Gene CPF_2068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2068
Symbol
ID	4201670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2306987
End bp	2308147
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	29%
IMG OID	638082933
Product	stage IV sporulation protein B
Protein accession	YP_696497
Protein GI	110800995
COG category
COG ID
TIGRFAM ID	[TIGR02860] stage IV sporulation protein B

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATA TGAACAAAAG AATAAAGATT ATATCAATAA TAATGATGTC TTTAATATTA 
CTTTTATCCT CTGTAACATT TGCAAGGGAT TATTGTGAGA GTAATAATGT TTTTGCAAGT 
AGCAATTTCT ATTCTTTAAA TTCTAAGAGT AGTAATGATG AAAAGTTTAA GAACAGATAT 
GGCGTAGCTC TTGTAAATAG TGAACAGGAA AAGAAAGATA TAGAGCTTTA TGCTGGAGGA 
AATTCAGTAG GTGTAAGGGT TTCAACAGAT GGTGTATTAG CAGTAGGTTA TTCAGACTTA 
ACAACAGGAG AAGGAGAAGT AGAGAGTCCA GCTCAAAATG GTGGAATACA AATTGGTGAT 
AGACTTATAA GTGTAAATGG AAATAAAATA AAAAATTCAA AAGATTTATC AAAAAAAATC 
AACGAGAGTA AATCAGAAAA TGTTGAAATA TTAATTGAGA GAAATGGTGA AGAAATAACT 
AAAAATATAA ATTTATCAAA AAATGCAGAT GGTGATTATA AAATAGGTCT TTGGGTAAGA 
GATTCTACTG CTGGTGTAGG TACACTTACT TTCTATGATA AAGAAAGTGG AAAATATGGA 
GCAATAGGTC ATCCAATAAC AGATAGTGAA ACAGAAAAAA TTCTTTCAAT AAAAAATGGA 
GATCTTTTAA ATTCTTCAAT AATAAGCATA AAAAAAGGTG TTAAAGGTAA TCCAGGAGAA 
TTAAGAGGAA TTTTTTCAAG TGATAAGAAA CCAATAGGAA ATGTTACAGG AAATACACAA 
TGTGGAATAT TTGGTAGCAT GAATACAGAA AATTTAAAAA ATATTAATAA TAAAACTTAT 
AAAGTTGGTT GGAGAGATGA AATTCAGCCA GGACCAGCAC AAATTATAAC TACTATTGAT 
GAAGAAGGTC CTAAGCTTTA TGATATTGAA ATTGTAAAAC TTGCAAAGCA AGATAGCATT 
AGTACAAAGA GTATGGTAAT TAAGATTACA GATGAAAGAT TATTAGAAAA AACTGGTGGT 
GTTGTCCAAG GAATGAGTGG AAGTCCAATT ATACAAAATG ATAAAATAAT TGGTGCTGTG 
ACACATGTTT TGGTTAATAA ACCTGAAGTA GGATATGGAA TTTATATAGA GTGGATGTTA 
AAAGATGCAA AAATTATATA A

Protein sequence

MKNMNKRIKI ISIIMMSLIL LLSSVTFARD YCESNNVFAS SNFYSLNSKS SNDEKFKNRY 
GVALVNSEQE KKDIELYAGG NSVGVRVSTD GVLAVGYSDL TTGEGEVESP AQNGGIQIGD 
RLISVNGNKI KNSKDLSKKI NESKSENVEI LIERNGEEIT KNINLSKNAD GDYKIGLWVR 
DSTAGVGTLT FYDKESGKYG AIGHPITDSE TEKILSIKNG DLLNSSIISI KKGVKGNPGE 
LRGIFSSDKK PIGNVTGNTQ CGIFGSMNTE NLKNINNKTY KVGWRDEIQP GPAQIITTID 
EEGPKLYDIE IVKLAKQDSI STKSMVIKIT DERLLEKTGG VVQGMSGSPI IQNDKIIGAV 
THVLVNKPEV GYGIYIEWML KDAKII