Gene CPR_2603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2603
Symbol
ID	4205810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2837508
End bp	2838944
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	30%
IMG OID	642567153
Product	6-phospho-beta-glucosidase bgla
Protein accession	YP_699850
Protein GI	110802745
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATATATG AAAAATTAGA TAACTTTAGA AGTGATTTCC TATGGGGATC AGCATCAGCA 
GCATATCAAG TTGAAGGTGG ATGGGATCAA GATGGAAAAG GAAAAAGTAT TTGGGATATA 
TATACTAAAA AGGAAGGGAC AACCTATAAA AATACTAATG GGGATATAGC AGTAGATCAT 
TATAACAGAT ATAAAGAAGA TGTATCTTTA ATGGCAGAAA TGGGATTAAA AGCTTATAGA 
TTTTCAATTG CATGGACTCG TATATATCCT AATGGTAGAG GAAAGGTAAA TGAAGAAGGA 
CTTAAGTTTT ATGAAAATTT AATTGATGAG CTAATAAAAA ATGATATAAC TCCAATAGTT 
ACATTATATC ACTGGGATTT ACCACAGCAT CTACAGGATT TATATGGTGG ATGGGAATCA 
AGGGAAATAA TAAACGATTT CAACAATTAT TGTGTAACTT TATTTAAGAG ATTTGGTAAT 
AAGGTTAAAT ATTGGGTTAC GTTAAATGAA CAAAATGTAT TTTTAACATT AGGATATTTA 
ACAGCATTAC ATCCACCAGG AGTTAAGGAT CAAAAGAGAA TGTTACAGGC AAATCATATT 
GCAAATTTAG CAAATGCAAA GGTTATTGAA TCTTTTAGAA AGTATGTTTC AAATGGAATG 
ATTGGTCCAA GCTTTGCATT CAATCCTAAT TATGCTTATA GTTGTAATCC ACAAGATGTG 
TTAGCTGCAG AAAATGCAGA AGATTTAAAT TGTAATTGGT GGCTTGATGT TTATTGTAAG 
GGTGTATATC CAACGTTTGC ATTAAGATAT TATGAAAGAT TAGGAATAGC ACCAATAATT 
GAGGATGGGG ATCTTGAATT ATTAGCAAGA GTAAAACCAG ACTTTATTGG AATTAATTAT 
TATCAAACAA CAACAGTTGC AATGAATTCA TTAGATGGGG TTGGAGCTTC TGAAGGAATG 
AATAATACTG GTAAAAAGGG AACTACAAAG GAAAGTGGAA TACCAGGTGT ATATAAAAAT 
GTAAAAAATC CTTACTTGGA AACAACTAAT TGGGATTGGA ATATAGATGC AACAGGGCTG 
AGAACTGGTT TAAGAAGATT AACAAGTAGA TATGGATTGC CTATATTAAT TACAGAAAAT 
GGCCTTGGTG AATTTGATAA GCTAGAAGAT AATATAGTAA ATGATGATTA TAGAATTAAA 
TATTTAAAAG AACATATTAT TGCATGTAAA GAAGCAATTA CTGATGGTGT TGAGCTTTTA 
GGATATTGTA CTTGGTCATT TACAGATTTG TTAAGCTGGC TTAATGGATA TCAAAAACGT 
TATGGATTTG TATATATTGA TAGAGATGAA AATGATGAAA AAGATTTAAG AAGAATTAAG 
AAGAAAAGTT TCTATTGGTA TAAGGATGTA ATAAGTAGTA ATGGTGAAAA TTTATAA

Protein sequence

MIYEKLDNFR SDFLWGSASA AYQVEGGWDQ DGKGKSIWDI YTKKEGTTYK NTNGDIAVDH 
YNRYKEDVSL MAEMGLKAYR FSIAWTRIYP NGRGKVNEEG LKFYENLIDE LIKNDITPIV 
TLYHWDLPQH LQDLYGGWES REIINDFNNY CVTLFKRFGN KVKYWVTLNE QNVFLTLGYL 
TALHPPGVKD QKRMLQANHI ANLANAKVIE SFRKYVSNGM IGPSFAFNPN YAYSCNPQDV 
LAAENAEDLN CNWWLDVYCK GVYPTFALRY YERLGIAPII EDGDLELLAR VKPDFIGINY 
YQTTTVAMNS LDGVGASEGM NNTGKKGTTK ESGIPGVYKN VKNPYLETTN WDWNIDATGL 
RTGLRRLTSR YGLPILITEN GLGEFDKLED NIVNDDYRIK YLKEHIIACK EAITDGVELL 
GYCTWSFTDL LSWLNGYQKR YGFVYIDRDE NDEKDLRRIK KKSFYWYKDV ISSNGENL