Gene CPR_2295 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2295
Symbol
ID	4204344
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2520063
End bp	2521442
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	32%
IMG OID	642566846
Product	beta-glucosidase a
Protein accession	YP_699570
Protein GI	110801670
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATATA CTTTCCCAGA AAACTTTTGG TGGGGAGCTG CAACTTCAGG ACCTCAGTCA 
GAAGGTAGGT TTAATAAAAA ACATGACAAT GTATTTGATC ACTGGTTCGA TATAAATCCA 
GAGTTATTTC ACAATGGTAT AGGACCAAAT ATAGCATCAA ATTTTTATAA TAGTTACAAA 
GAAGATTTAG CAATGCTAAA AGAAATTGGA TTAAATTCAT TTAGAACTTC AATTCAATGG 
ACAAGAGTAA TTAAGGATTT TGAAACTGGT GATATAGATG AAGATGGAGT AAGATTTTAT 
AATGGTGTAA TAGATGAATG TTTAGCAAAT GAAATAGATA TAATAATGAA TTTACATCAC 
TTTGATCTTC CTGTTGAATT ATATGATAAA TATGGTGGGT GGGAATCAAA GCATGTTGTA 
GAATTATTTG CGAAATTTGC TAAGACTGCC TTTAGTTTAT TTGGTGATAG GGTTAAGAAG 
TGGGCTACGT TTAATGAACC TATAGTTATT ATTGAAGGAC AGTTTTTATA TAAATGGCAT 
TATCCTTGTA TAGTTGATGG AAAAAGAGGG CTTCAAGCTG CCTATAATAT AGCATTAGCT 
TCTGCTAGAG CCATAGAAGA GTATAGAAAA TTAGGACAAG ATGGAGAAAT AGGAATAATA 
GTTAACTTAA CGCCAGCATA TCCAAGAAGT GAGTCAAAAG AAGATTTAAG AGCTGCTGAA 
ATTGCCAATG CTTTCTTCAA TGAGTTATTC TTAGATCCAG CAACTAAGGG AGAATTTCCT 
AAGAACTTAG TTGAGGTTTT AGAAAAAGAT GGAGTAATGT GGAATTCTAC TAAGGAAGAA 
TTACAGGTTA TAAAAAATAA TACTGTGGAT TTCTTAGGGG TAAACTACTA TCAACCAAGA 
AGGGTTAAAG CTAGAGAAGA GGAATATGGT GGAGAAACAT GGGCTCCAGA AAAATATTTT 
GATAATTATG ATATGCCAGG AAAGAGAATG AATCCTCATA GAGGATGGGA AATATATCCT 
AAGGCAATTT ATGATATAGC TAAAAATGTA CAAGAGAACT ATGGCAACAT AAAATGGTTC 
ATTTCAGAGA ATGGAATGGG TATTGAAGGA GAAGAAAAGT TCAAAAATGC TGAAGGTATA 
ATTGAAGATG ATTATAGAAT TGAATTCATA ATAGAGCATT TAGAATGGCT TCATAAGGCT 
ATTGAAGAGG GTTCAAATTG TGTGGGATAT CACTTATGGA CTCCAATAGA TTGTTGGTCA 
TGGTTAAATT CATATAAAAA TAGATATGGA TTTATATCAT TAGATTTAGA AACTCAAAAG 
AAAACTATTA AAAAATCAGG AAGATGGATA AAAGAAGTTT CTAAGAATAA TGGTTTTTAA

Protein sequence

MKYTFPENFW WGAATSGPQS EGRFNKKHDN VFDHWFDINP ELFHNGIGPN IASNFYNSYK 
EDLAMLKEIG LNSFRTSIQW TRVIKDFETG DIDEDGVRFY NGVIDECLAN EIDIIMNLHH 
FDLPVELYDK YGGWESKHVV ELFAKFAKTA FSLFGDRVKK WATFNEPIVI IEGQFLYKWH 
YPCIVDGKRG LQAAYNIALA SARAIEEYRK LGQDGEIGII VNLTPAYPRS ESKEDLRAAE 
IANAFFNELF LDPATKGEFP KNLVEVLEKD GVMWNSTKEE LQVIKNNTVD FLGVNYYQPR 
RVKAREEEYG GETWAPEKYF DNYDMPGKRM NPHRGWEIYP KAIYDIAKNV QENYGNIKWF 
ISENGMGIEG EEKFKNAEGI IEDDYRIEFI IEHLEWLHKA IEEGSNCVGY HLWTPIDCWS 
WLNSYKNRYG FISLDLETQK KTIKKSGRWI KEVSKNNGF