Gene CPR_0631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_0631
Symbol	bcn
ID	4205789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	752746
End bp	753816
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	31%
IMG OID	642565191
Product	bacteriocin
Protein accession	YP_697958
Protein GI	110802571
COG category	[T] Signal transduction mechanisms
COG ID	[COG3103] SH3 domain protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.420339
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAGAT GTTTCCCATA TAACTTTTCA CCTCAATATA CTTCAAGAAA CTATACAGGA 
CCTAATCCAT TAGGAGCACC AGAGGCAGTT GCACTTAAAA ATTTAGTTGA AAGAATAAAT 
TCTAGTTCTA GTGAAATGGT AGTTTTAGAT TTCCATGGAT GGATGAATTT CACTCAAGAT 
AATGCAGAAT TAGGAAGATA TTTTGGAAAT CAATTTGGAT TTGGACATAA TAATGGATAT 
AGCTCAGGTT TTTTCTCAAG TTGGGCAACA ACTTTAAGGA ATACAAAAGC AGTTTTAATT 
GAGTATCCTA CAAATACTTA TAGCTATAAT GATGTTATAA ATAAAAATTA TATAGGAAAA 
ACATTCAATG GAATAATAAA TATCATTAAG AATAATCCTA ATGGTGGAGA TGTAGATAAT 
GGTGGAAATT CAGGAGGAAG TTCATCTTCG GATGTGAGAT ATATAGCAGC TGGAGAAGTA 
ATAAATGTAC AATCATTCCT AAATGTTAGA AAAGGACCAG GGACAAATTA TGATTCTATA 
GGACAACTTC ATCAAGGCGA AAAAGTTAGT ATAGTAGCTA CAAATAAAGA GTGGAATAAG 
ATAGAATATG GTACTGGGTA TGGATACGTT CATAAAGATT TTGTAAATAT ATTATATAGA 
GATATAAATG AGGAACTGAG AGGTTTAATG GTTAGGTATG AGTATATGTA TGGACCACAA 
TGGAATGGAA TAACTTCCGG AGTTGCTAAT TTAGCTAAAT TTTATAATTT GGTTAGGAAT 
GGTTCTATAG TTGATTTGAA AAATCAAGGT TGGGATGAAA ATCAATATTA TTTTAATGGT 
AAAATTTACA GAAAAGATGC TCCAGGAAAT ATTCTTTATG GATATTTAGG AAAGGTTTTT 
GGTTTTACAG ATGAATTATT ATTGAGAGCT GCAGGATTTG CACAAAAAGA AGCTGGAACA 
AGCAAACCAG AATTTGGAGA TCCTTTTGGA AATCCACCAT ATGGAGATGA TCCTTATGAT 
CAAGAATGTA TAAAAGACGG TATTGATTAT TTTAATAAAT ACAGAAAATA G

Protein sequence

MNRCFPYNFS PQYTSRNYTG PNPLGAPEAV ALKNLVERIN SSSSEMVVLD FHGWMNFTQD 
NAELGRYFGN QFGFGHNNGY SSGFFSSWAT TLRNTKAVLI EYPTNTYSYN DVINKNYIGK 
TFNGIINIIK NNPNGGDVDN GGNSGGSSSS DVRYIAAGEV INVQSFLNVR KGPGTNYDSI 
GQLHQGEKVS IVATNKEWNK IEYGTGYGYV HKDFVNILYR DINEELRGLM VRYEYMYGPQ 
WNGITSGVAN LAKFYNLVRN GSIVDLKNQG WDENQYYFNG KIYRKDAPGN ILYGYLGKVF 
GFTDELLLRA AGFAQKEAGT SKPEFGDPFG NPPYGDDPYD QECIKDGIDY FNKYRK