Gene CPR_1697 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1697
Symbol
ID	4204905
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	1892297
End bp	1893505
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	27%
IMG OID	642566247
Product	hypothetical protein
Protein accession	YP_699012
Protein GI	110801954
COG category	[R] General function prediction only
COG ID	[COG1323] Predicted nucleotidyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATAA CTGGCATAAT AACTGAATAT AACCCTTTTC ATCTAGGTCA TGAACTTCAT 
CTAAAAAATT CAAAAGAGAT TACAAATTGC GATGGAGTTA TTTGTGTTAT GAGTGGAAAC 
TTTGTGCAAA GAGGTTTGCC TGCTTTAACA GACAAATGGA CTAGAACAAA AATGGCCTTA 
GAAGCTGGAG TTGATTTAGT TGTAGAACTT CCAACTCTTT TTGCAACTTC TTCAGCAGAA 
TTTTTTGCCT TTGGTGCAGT ATCTTTGCTT AATTCTTTAA ATGTAGTTAA TAATATTTGT 
TTTGGATCAG AATGTGGAGA TATAGATTTA ATTAAAAAAC TTAGTGAAAT TATTGTCAAT 
GAACCTCCTA TATTCAAAGA ATATTTAAAG GATTATTTAA AGGAAGGCCT TCCCTTTCCT 
AAAGCTAGAA GTGAAGCTTT AATGAAGTAC TTAGATTATA ATAATTATAA AACTGATTTT 
TCATACTTAG AAAAAGTTCT AAACTCTTCT AATAATATAT TAGCCATTGA ATATTGTAAA 
AGCCTTTATA AGCTTCAAAG TACTATAAAA CCTTTTACTA TACAAAGATT AGGAGCAGAT 
TACAACGATG AAGAACTGTC AAAAAATGAA ATAGCCTCTG CTTCTGCCAT AAGAAAAAGT 
ATTTACACTT CAAATATAGA AGAAAGTCTT GATTTTATGC CTGAGTATAG CTATAACTTA 
TTAAAAAATA CTTCTTTTAG TGATTTAGAC AAAATGTTTG ACTTAGTAAA ATACGCTATA 
GTAAGCAATC CTAATATATT AAAAGAAATA CCAGAGGCTT CTGAAGGAAT AGATAATAAG 
ATAATTCAAA ACATAGGAAA AGCTAATTCT TTAGATGAAT TAATAAACCT ATGCAAAAGT 
AAGCGTTATT CATATACTAG ATTAAACAGA ATTTTATGTC ACATACTATT AAATGTAAAT 
AAAGATCTTC TTTCTCTTAG AAAATATTCT CCTAATTATG TAAGAATCTT AGGATTTAAT 
AATAAAGGAA GGGAAATTTT AAAAGAGATT AAGAAAAATT CTGAAATAAA TATCGTTAAT 
AAATTATCAA AAGCTAAAAC AGATCCTTTG TTAGAATTTG ACATAAAAGC CACTAATATT 
TATAGCTTTC TAAATCCATC AGTTAAAATT AACAGTGATT ATTTAATTAG TCCTATTATT 
TTTAGATAA

Protein sequence

MNITGIITEY NPFHLGHELH LKNSKEITNC DGVICVMSGN FVQRGLPALT DKWTRTKMAL 
EAGVDLVVEL PTLFATSSAE FFAFGAVSLL NSLNVVNNIC FGSECGDIDL IKKLSEIIVN 
EPPIFKEYLK DYLKEGLPFP KARSEALMKY LDYNNYKTDF SYLEKVLNSS NNILAIEYCK 
SLYKLQSTIK PFTIQRLGAD YNDEELSKNE IASASAIRKS IYTSNIEESL DFMPEYSYNL 
LKNTSFSDLD KMFDLVKYAI VSNPNILKEI PEASEGIDNK IIQNIGKANS LDELINLCKS 
KRYSYTRLNR ILCHILLNVN KDLLSLRKYS PNYVRILGFN NKGREILKEI KKNSEINIVN 
KLSKAKTDPL LEFDIKATNI YSFLNPSVKI NSDYLISPII FR