Gene CPR_1564 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1564
Symbol
ID	4205481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1756065
End bp	1757774
Gene Length	1710 bp
Protein Length	569 aa
Translation table	11
GC content	27%
IMG OID	642566115
Product	hypothetical protein
Protein accession	YP_698880
Protein GI	110802196
COG category	[S] Function unknown
COG ID	[COG2898] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.201819
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGGGATT CACTAAAAAA AAGTTATAGA CATTTAAAAA ATATTTTAGG ATTTGTTACT 
GATAAAAGAA ATTATGAAAA TATAAAGAAG CTATTAAAAA ATTACAAAAT CTTAAGTGAT 
ATATCAAATA TAATAGTATC AGTTTTGGTA TTTCTAAGTG GTATTCTTTT AATAATTTCA 
GGGATTTATC CTAGTATATT TTATAAGATA AAATTTTTAG ATAATATATA CAGTTTATCT 
TTTTTAAGGT TTTCACATAG AGCTTCAATA TTAATTGGAT TAATGTTAAT AATGACCTCT 
AAGGAAGTTT TCTTTAAGGT AAAAAGAGCT TATTATGTTA CATTAACATT GCTTATAGTA 
GGAGGAGCCT TTGCCTTTAT AAAAGATTTA GATTACAAAG AAGGAATTTT TATTTTAGGA 
GTAATAATAC TTCTAATATT ATCAAAAAAG AGTTTTTACA GAAAAAGTAT TCCTATTAAG 
GTTACTAAAT TAAGTGGGAT ATTAATAGTT CTTTCAATTG TAATGATTAT CTTTGCGAGT 
TTTATACATA AATTTAACAT ACATTTTAGC AAGAACTATA AATACTATAT AGACTTTTTC 
CATAGCACAA AGGGGTATTT AAGAATAGCA TTATTCACAT ATATATCCTT TATAATATTT 
GTGATAATAT GGTATTTAAC AATGCCTAAA ATAGAAGATG ACGAAAGGTA TATGGATGCT 
GATTTAGAAA AGGTATCAAA ATTCTTTAAA GAAATAGATT ATGGAACAAT ATTCTCCCAT 
TTAGTTTATT TAAAGGATAA AAAGGTCTTT TGGGCTAATG AAGGAGAGTC CTTAATAATG 
TATAGCAAGT ACAAAGATAA GATAATAGTT TTAGGAGATC CTATAGCTAC TAAGGAAAAC 
CTATATAGTT GTATAGAAGA GTTTCAAGCT TTTACAAATT TATATGGATA TGATGTTGTC 
TTTTATGAAA TAGAAGAAAA AAACTTTTCT ACCTATCATG ATGCAGGGTA TTATTTCTTT 
AAGTTAGGAG AAGAGGCAAG GATAGATTTA GAAGAATTTA ATTTGATTGG TTCTAAAAAG 
AGTGCCTTTA GAAACACCTT AAGAAGAGTT GAAAGGGAAG GATATAATTT TAGCATTATA 
GAGCCTCCTT TTAATAATGA GGTAGTAAGT CAATTGAAGG AAATATCTGA TAAATGGTTA 
GGGGACAGAA AAGAAAAGGG ATTTTCTTTA GGATGGTTTA GTGAGGATTA TATACAAAGA 
TCACCTATAG CTATTTTAAA GAATGAAGAA GAAAATAAGA TTATGGGCTT TGTAACAATA 
ATGGATGCTA ATGATGGAGG GGAGACAGTA GCAATAGATT TAATGAGAAT AGATAAAGAT 
GCTCCAAATG CCTCTATGGA TTACCTAATG CTTAATTTAT TCTTAACCTT TAAAGAAAAA 
GGATATAAGT ATTTTAGCTT AGGAGAAGCA CCATTATCTA ATGTAGGATT TAACACTCAT 
TCACATTTAC AAGAAAAGCT TGCAAGGTTA GTTTATAATA GTGGTAATAT ATTCTATAGT 
TTTGATGGAC TAAGAAGATA TAAGTCAAAG TTTTCTCCAA TTTGGCAACC TAGATATTTA 
GCATATCCTA AGTTTATGTC CTTACCAGAG GTGTTTATTA ACTTATGTTT ATTAATAGCT 
AATTCAAAGG AAAGAGTAGA GAAAAAATAA

Protein sequence

MWDSLKKSYR HLKNILGFVT DKRNYENIKK LLKNYKILSD ISNIIVSVLV FLSGILLIIS 
GIYPSIFYKI KFLDNIYSLS FLRFSHRASI LIGLMLIMTS KEVFFKVKRA YYVTLTLLIV 
GGAFAFIKDL DYKEGIFILG VIILLILSKK SFYRKSIPIK VTKLSGILIV LSIVMIIFAS 
FIHKFNIHFS KNYKYYIDFF HSTKGYLRIA LFTYISFIIF VIIWYLTMPK IEDDERYMDA 
DLEKVSKFFK EIDYGTIFSH LVYLKDKKVF WANEGESLIM YSKYKDKIIV LGDPIATKEN 
LYSCIEEFQA FTNLYGYDVV FYEIEEKNFS TYHDAGYYFF KLGEEARIDL EEFNLIGSKK 
SAFRNTLRRV EREGYNFSII EPPFNNEVVS QLKEISDKWL GDRKEKGFSL GWFSEDYIQR 
SPIAILKNEE ENKIMGFVTI MDANDGGETV AIDLMRIDKD APNASMDYLM LNLFLTFKEK 
GYKYFSLGEA PLSNVGFNTH SHLQEKLARL VYNSGNIFYS FDGLRRYKSK FSPIWQPRYL 
AYPKFMSLPE VFINLCLLIA NSKERVEKK