Gene CPR_1627 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1627
Symbol
ID	4205044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1816958
End bp	1818664
Gene Length	1707 bp
Protein Length	568 aa
Translation table	11
GC content	29%
IMG OID	642566178
Product	hypothetical protein
Protein accession	YP_698943
Protein GI	110803235
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000849473
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTTTA CTGCAAAGTA TTGTGATAGT TTTGAATCCA TAATAAATAG CGAAGGGTTT 
ATAAAAGTTT TAGAAACTTA TTTAAAAAAA ACTAAAAATA AGAAGAGTCA TAATTTTAGA 
TTTTTAAGTG AAGCCATAGG TACTGAAGAT ATAAAGGTTA TATCTAGGTA TTTAATAAGT 
GCATTAAAAC TATTATCTAT GATGGGGGCT GATGAGGTGA TAGTTGTTAA TGATGCTTTT 
GAAGGTTTAC TTGAAGATAA AAAATCTTTT GCTGACATTA TAGAAGATGT TTATTCTTTT 
TGGAGAAAAT TAGAAAGATA CACTGTTATT CAAAACAATA AAATAAAAGA TGGTATTGCA 
GCAGTTGGAT TTATAGATGC TAATAAAAAT TTTAATGATT TAATTTTAAG ATTTTACAGG 
AGACTCCAAA AAAATTTATT AGGAAGTATG CCTAATATAC TTAGACAAGT TTCTGCTGGT 
GGAAATGCAA GTATTATGGT AAGTAATTTA ATATGGCCAA GTTCAAGGGA ATATTCCATA 
TTAGAACATA TTCCATTTAT AGATGCAATA TCATTAGAAG CGCCATTTAT AACTTATCCA 
AGTAAGAATA CTAGGGATGG TATATTCTTA GAAACAAGTG AAAATCCATT AAGTGGATCT 
CATATAAATA GTGAAGAATG GTTTTGTTAT CCTGCTAAGG TAGGGGAATT ATTAGCATAT 
GTATATTTCC ATAGAGATTT TATGTCTCAT GGAATAAGTT TATGTAATTT GTTTGATTTA 
GCAACTGTAG AGGAATGTAG AGGGGTAAAA CCAGATATTA TTTATATCTT TGGAGCTAAA 
GATGATGATG ATGAGTTAAA AACTTGTTTC TATGATGATG AAAAAAATAA CATAATGCTA 
GGGTATGCTA ATTATAGTGA AGAAATAGAT TATTTTGGGT ATATGAAAAA GATGATATTA 
ACTCTTCATA ATATAATAAT GATAAAAAGA GGATATATGC CTATTCATGG AGCTATGGTC 
AATGTGGTTC TTAAAAATGG AAAAGAAGCT AATATTGTAA TAATGGGTGA TAGTGGAGCA 
GGAAAATCTG AAAGCTTAGA AGCCTTTAGA GCACTGAGTG AAGAATATAT AAGCGATATG 
ACCATAATTT TTGATGACAT GGGTGTATTT AAAAATGTAG ATGGCATAAT TAAGGGGTAT 
GGAACTGAAA TAGGAGCCTT TGTAAGACTT GATGACTTAG ATCAAGGGTA TGCTTTTAAA 
GAAATTGATA GAAGTATATT TATGAATCCT GATAAGATAA ATGCTAGACT TCTTATGCCA 
GTATGTAAGT ATGACGATAT AATAAGGGGA TATGATGTAG ATCTTTTCCT TTATGCTAAT 
AATTATGATG GATTAGATGA GGGAGAAAAA TCTATTGAAT ATTTTAATAA TCCAGAGGAA 
GCTAAGAAAA TTTTTAAAGC TGGTGCTAGA ATGGCAAAGG GAACAACTAC TGAAAATGGC 
TTAGTGGAAT CATATTTTGC TAATCCTTTT GGACCTGTGC AAAAGAAAGA AGAGATGGAT 
TTAATAATAG ATAAATATTT TGAAGATATG TTTAATAATA AAGTGAAGGT TGGACAAATA 
AAAACTTGTT TAGGAGTTTT AGGCCTTGAA AAGGAAGGAC CTAAAAAAGC AGCCATAGAA 
CTTTTTAATA TAATTGAAAA AATGTAA

Protein sequence

MNFTAKYCDS FESIINSEGF IKVLETYLKK TKNKKSHNFR FLSEAIGTED IKVISRYLIS 
ALKLLSMMGA DEVIVVNDAF EGLLEDKKSF ADIIEDVYSF WRKLERYTVI QNNKIKDGIA 
AVGFIDANKN FNDLILRFYR RLQKNLLGSM PNILRQVSAG GNASIMVSNL IWPSSREYSI 
LEHIPFIDAI SLEAPFITYP SKNTRDGIFL ETSENPLSGS HINSEEWFCY PAKVGELLAY 
VYFHRDFMSH GISLCNLFDL ATVEECRGVK PDIIYIFGAK DDDDELKTCF YDDEKNNIML 
GYANYSEEID YFGYMKKMIL TLHNIIMIKR GYMPIHGAMV NVVLKNGKEA NIVIMGDSGA 
GKSESLEAFR ALSEEYISDM TIIFDDMGVF KNVDGIIKGY GTEIGAFVRL DDLDQGYAFK 
EIDRSIFMNP DKINARLLMP VCKYDDIIRG YDVDLFLYAN NYDGLDEGEK SIEYFNNPEE 
AKKIFKAGAR MAKGTTTENG LVESYFANPF GPVQKKEEMD LIIDKYFEDM FNNKVKVGQI 
KTCLGVLGLE KEGPKKAAIE LFNIIEKM