Gene CPF_2267 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2267
Symbol
ID	4201958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	2516254
End bp	2517333
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	26%
IMG OID	638083132
Product	putative spore coat protein
Protein accession	YP_696690
Protein GI	110800484
COG category	[R] General function prediction only
COG ID	[COG2334] Putative homoserine kinase type II (protein kinase fold)
TIGRFAM ID	[TIGR02906] spore coat protein, CotS family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAAGC ATTCTAAAAA GTTTAATGAA GCTGATGAAA TTTTTAATGC TGTAGAATCC 
ATAGTTTTAC CTATGTATAA TTTAGAAAAC TATTCTATAG AGAATATAAA ATTTAAAAAT 
ACAGATAAAA ATAGAGCTGT TTATAAATTA ATTGATGATA TTAATAATCC TAAAAATACC 
TTTTGCTTAA AAAAGGTTTA TTATGATGAA GGGACTCTCT TATTCATATA TTCAGTTATG 
GAATGGTTTG CTAGAAATGA AATTAAGCTT CCAAAAATGC TCCCTTCAAA GTTTAATGGT 
AGATTTGTTA AAGCAAATAA TATGCTTTTT ATGCTCTGTC CATGGGTTAA AGGTGAAAAA 
TGTAACTTCG ATAACTTACA ACATATCTTA CTATCCATAG AAAATCTAGC TAAAATGCAT 
AATTGTTCAA GAAACTTTAA AGCAATTGAA GGTAGTTTAA TTAAAACTGG ATTTGATAGT 
CTCTACATAT CCACATTAAA ACACTTTAAT AAGATTCTTT CATCATTTAA TACTGCAACT 
AAAATGAAAC ATAAGGACAA GTTTTCATCA ATATTTTTAG ATGTTTTTGA TGAAAATATT 
TATCTAGCTA AAGAAGCTCT CTTAGTTTCA GGTTCTATTA ATGACAAAAA TTTAAGTAGA 
TCTCTTTGCC ATGGAGATTA TGTAAATAAA AATATTTTAA TTGATAATAC TGATGTTTGG 
GTAATTGATT TTGATAAAGC ATCCTTAAAT TATTCTATGT ATGATTTATG TTATTTTATG 
AGACGTTTAT TAAAAAGATC AAATACTAAT TGGGATATAG ACTTAACAAG AAAGATAATT 
AAAACATATA ATTCAATTGC TCCTCTTACA GAGGATGACT TCAAATATGT TTTTTCATAT 
CTAGCATTTC CACAAAAATA TTGGCGCTTA TCAAAGGACT ATTATAATAA CATAAAAAAA 
TGTAATAAAT CAATGTTTGT AGAATCTCTT AAGGAAGTTT CACTAGATAC CTATGCTCAG 
GTTAGATTTG TTGGAGAACT TAGAACATTG TTTTCTACTG AATTTAAAAT TAAAGTTTAA

Protein sequence

MGKHSKKFNE ADEIFNAVES IVLPMYNLEN YSIENIKFKN TDKNRAVYKL IDDINNPKNT 
FCLKKVYYDE GTLLFIYSVM EWFARNEIKL PKMLPSKFNG RFVKANNMLF MLCPWVKGEK 
CNFDNLQHIL LSIENLAKMH NCSRNFKAIE GSLIKTGFDS LYISTLKHFN KILSSFNTAT 
KMKHKDKFSS IFLDVFDENI YLAKEALLVS GSINDKNLSR SLCHGDYVNK NILIDNTDVW 
VIDFDKASLN YSMYDLCYFM RRLLKRSNTN WDIDLTRKII KTYNSIAPLT EDDFKYVFSY 
LAFPQKYWRL SKDYYNNIKK CNKSMFVESL KEVSLDTYAQ VRFVGELRTL FSTEFKIKV