Gene CPR_0877 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_0877
Symbol
ID	4204180
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1012783
End bp	1013931
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	32%
IMG OID	642565436
Product	sialidase
Protein accession	YP_698202
Protein GI	110802436
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4409] Neuraminidase (sialidase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0420038
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTAACA AAAACAACAC CTTTGAAAAA AATCTAGATA TAAGCCATAA ACCAGAACCA 
CTAATACTAT TTAACAAGGA TAGTAACATA TGGAATTCAA AGTATTTTAG AATTCCCAAT 
ATACAATTAT TAAATGATGG CACAATTTTA ACCTTTTCAG ATATTCGTTA TAATGGCCCT 
GATGACCATG CTTATATAGA CATAGCTTCT GCACGCAGTA CTGATTTTGG AAAGACATGG 
AGCTATGATG TAGCAATGAA AAATAATCGT ATTGACTCTA CTTATTCTCG TGTAATGGAC 
TCCACAACAG TTATTACAAA TACAGGTAGA ATAATATTAA TTGCAGGCTC ATGGAATACA 
AATGGAAACT GGGCAATGAC TACTTCTGCA AGAAGAAGTG ATTGGTCTGT TCAAATTATT 
TATTCTGATG ATAATGGATT AACTTGGTCT AACAAAATAG ATTTAACCAA GGACTCATCA 
AAAGTAAAAA ATCAACCAAG TAATACAATT GGATGGCTAG GAGGAGTTGG CTCAGGTATT 
GTAATGGATG ATGGAACAAT AGTTATGCCA GCACAAATTT CCTTAAGAGA AAATAATGAA 
AATAACTATT ATTCATTAAT TATCTATTCA AAGGATAATG GTGAAACATG GACAATGGGA 
AACAAGGTTC CTAATTCAAA TACTTCTGAA AATATGGTCA TAGAATTAGA TGGAGCTTTA 
ATTATGAGTA CAAGATATGA TTACTCTGGT TATAGGGCAG CATACATCTC TCACGATTTA 
GGAAGCACCT GGGAAATATA TGAACCTTTA AACGGTAAAG TTTTAACTGG TAAGGGCTCT 
GGATGCCAAG GTTCATTTAT TAAAGCTACT ACTTCAAATG GACATAGAAT AGGATTAATT 
TCAGCACCTA AAAACACTAA AGGTGAATAT ATAAGAGACA ATATTGCTGT TTATATGATT 
GACTTTGATG ATTTATCTAA AGGTGTTCAG GAAATATGTA TTCCTTACCC TAAAGATGGT 
AACAAATTAG GCGGTGGCTA TTCTTGTCTA TCCTTTAAAA ATGACCATTT AGCCATTGTT 
TATGAAGCCA ACGGAAATAT AGAATATCAA GACTTAACAC CTTATTACTT ACTAATTGAT 
AAAGAATAA

Protein sequence

MRNKNNTFEK NLDISHKPEP LILFNKDSNI WNSKYFRIPN IQLLNDGTIL TFSDIRYNGP 
DDHAYIDIAS ARSTDFGKTW SYDVAMKNNR IDSTYSRVMD STTVITNTGR IILIAGSWNT 
NGNWAMTTSA RRSDWSVQII YSDDNGLTWS NKIDLTKDSS KVKNQPSNTI GWLGGVGSGI 
VMDDGTIVMP AQISLRENNE NNYYSLIIYS KDNGETWTMG NKVPNSNTSE NMVIELDGAL 
IMSTRYDYSG YRAAYISHDL GSTWEIYEPL NGKVLTGKGS GCQGSFIKAT TSNGHRIGLI 
SAPKNTKGEY IRDNIAVYMI DFDDLSKGVQ EICIPYPKDG NKLGGGYSCL SFKNDHLAIV 
YEANGNIEYQ DLTPYYLLID KE