Gene CPR_2266 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2266
Symbol
ID	4204934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2490206
End bp	2491354
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	27%
IMG OID	642566818
Product	hypothetical protein
Protein accession	YP_699542
Protein GI	110802894
COG category
COG ID
TIGRFAM ID	[TIGR02532] prepilin-type N-terminal cleavage/methylation domain

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.580808
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTATCA AAAAAAGAAA AAGTAAAAAA GGGTTTACAG TAATAGAAGC TATAATTAGT 
TTAGTTTTGT TTACTTTAAT AATGATACCC CTAGGTAGCT TTACTTTAAC AGCTGTTAAA 
ACATCAGCAA AAAGTGCCAC AAAAGAGCAG GCTATAAATG CTGGACAAGG TGTCATAGAA 
CAATTAAAAA CAATTAAATT AAGCCAGTTT AAGAAAATAG ACTCAGATGC AAATTATAGT 
GAGAGTAATA AAGCTACATT AAAGCTTGGA AACTTAAATG TTATAAAGAC AAAAGATGAT 
CCAACTTATA AAATTGAAGG TGAATATGTA GACCCTAATA ATAAGAAGAA ATTTAATATA 
GATGGAGATA TAACACAGGG GAAGCTTGAG GATAATGGAG AAAGTGGTAA GGAACATACT 
TTGGATAAAA AAGAGCCGAA AAAAAATTAT GTGGTATATA TAGGAGAAAG CCTTATAACA 
GTTTATAAAA TTGTTTCAAA AGAAAATATT TTAAAAAAAT ACATAGATAA CAATACAATT 
AAAATAATTG ATGATAAAGA TAATGACTTG GAAGAAGCTA AAATAGTAAA TGGAATTTTT 
AAAGGAAGTA GTATAAAGCT TAGACGCTGG TTACTTATAA AGAATAAAGA ACTAAAAAAT 
AATGATAATG AAATTACAAC TCTTTTTATA GATGAGAATA GTAATGGTGA GATAAATATA 
AAAGCAGAAA ATGAAGATAA GGGAGAAGAG ATATCAACCC CTGATAGTCC AAGTGAAGAA 
AGAAAAAAGC TTGTTAAAAT ATTAAATGAA TATACTGATG ATTTTGAATT AGAGGATGGA 
GAGAAAAAAA CTGATATAAT GGTGTATTTT TATAGAAGTT CTGCAAATAA AAAAATAGAT 
TTAAAAGTGT CAAATAAGTG TTCAGGAAGT CGATTGAACA TTTATACATG TAAGAATGAA 
GGAAGTGGAA TAAGTTATAA TATTTATACT TCAACTGAAA ATTCTCATGG CAATATAAGT 
GTATTTAAAA ATTATATAGA GGGAAATAGC GAAGATTTAA GAGGGCAATT ATTTAATATT 
AATTTAAAGA TTAAGGAAAA AGATGAGGTT CTTTATAACC TTAATACAAC TGAGTTTATA 
GGAGGGTGA

Protein sequence

MGIKKRKSKK GFTVIEAIIS LVLFTLIMIP LGSFTLTAVK TSAKSATKEQ AINAGQGVIE 
QLKTIKLSQF KKIDSDANYS ESNKATLKLG NLNVIKTKDD PTYKIEGEYV DPNNKKKFNI 
DGDITQGKLE DNGESGKEHT LDKKEPKKNY VVYIGESLIT VYKIVSKENI LKKYIDNNTI 
KIIDDKDNDL EEAKIVNGIF KGSSIKLRRW LLIKNKELKN NDNEITTLFI DENSNGEINI 
KAENEDKGEE ISTPDSPSEE RKKLVKILNE YTDDFELEDG EKKTDIMVYF YRSSANKKID 
LKVSNKCSGS RLNIYTCKNE GSGISYNIYT STENSHGNIS VFKNYIEGNS EDLRGQLFNI 
NLKIKEKDEV LYNLNTTEFI GG