Gene CPF_0985 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0985
Symbol
ID	4201816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	1135175
End bp	1136323
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	32%
IMG OID	638081867
Product	sialidase
Protein accession	YP_695432
Protein GI	110800384
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4409] Neuraminidase (sialidase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00120415
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATAACA AAAACAACAC CTTTGAAAAG AATCTAGATA TAAGCCATAA ACCAGAACCA 
CTAATACTAT TTAACAAGGA TAATAACATA TGGAATTCAA AGTATTTTAG AATTCCCAAT 
ATACAATTAT TAAATGATGG TACAATTTTA ACCTTTTCAG ATATTCGTTA TAATGGTCCT 
GATGACCATG CTTATATAGA CATAGCTTCT GCACGTAGTA CTGATTTTGG AAAGACATGG 
AGCTATGATA TAGCAATGAA AAACAATCGT ATTGACTCTA CTTATTCTCG TGTAATGGAC 
TCCACAACAG TTATTACAAA TACAGGTAGA ATAATATTAA TTGCAGGCTC ATGGAATACA 
AATGGAAACT GGGCAATGAC TACCTCCACA AGAAGAAGTG ATTGGTCTGT CCAAATGATT 
TATTCTGATG ATAATGGATT AACTTGGTCT AACAAAATAG ATTTAACTAA GGACTCATCA 
AAAGTAAAAA ATCAACCAAG TAATACAATT GGATGGTTAG GTGGAGTTGG CTCAGGTATT 
GTAATGGATG ATGGAACAAT AGTTATGCCA GCACAAATTT CCTTAAGAGA AAATAATGAA 
AATAACTATT ATTCATTAAT TATCTATTCA AAGGATAATG GTGAAACATG GACAATGGGA 
AACAAGGTTC CTAATTCAAA CACTTCTGAA AATATGGTCA TAGAATTAGA TGGCGCTTTA 
ATTATGAGTA CAAGATATGA TTACTCTGGT TATAGGGCAG CATACATCTC TCATGATTTA 
GGAACTACTT GGGAAATATA TGAACCTTTA AACGGTAAAG TTTTAACTGG TAAAGGCTCT 
GGATGTCAAG GTTCATTTAT TAAAGCTACT ACTTCAAACG GACATAGAAT AGGATTAATT 
TCAGCACCTA AAAATACTAA AGGTGAATAT ATAAGAGACA ACATTGCTGT TTATATGATT 
GACTTTGATG ATTTATCTAA AGGAGTTCAA GAAATATGTA TTCCTTATCC TGAAGATGGT 
AACAAATTAG GCGGTGGATA TTCTTGTCTA TCCTTTAAAA ATGGCCATTT AGGCATTGTT 
TATGAAGCCA ACGGAAATAT AGAATATCAA GACTTAACAC CTTATTACTC ACTAATTAAT 
AAACAATAA

Protein sequence

MYNKNNTFEK NLDISHKPEP LILFNKDNNI WNSKYFRIPN IQLLNDGTIL TFSDIRYNGP 
DDHAYIDIAS ARSTDFGKTW SYDIAMKNNR IDSTYSRVMD STTVITNTGR IILIAGSWNT 
NGNWAMTTST RRSDWSVQMI YSDDNGLTWS NKIDLTKDSS KVKNQPSNTI GWLGGVGSGI 
VMDDGTIVMP AQISLRENNE NNYYSLIIYS KDNGETWTMG NKVPNSNTSE NMVIELDGAL 
IMSTRYDYSG YRAAYISHDL GTTWEIYEPL NGKVLTGKGS GCQGSFIKAT TSNGHRIGLI 
SAPKNTKGEY IRDNIAVYMI DFDDLSKGVQ EICIPYPEDG NKLGGGYSCL SFKNGHLGIV 
YEANGNIEYQ DLTPYYSLIN KQ