Gene CPR_1051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1051
Symbol
ID	4204721
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	1196679
End bp	1198511
Gene Length	1833 bp
Protein Length	610 aa
Translation table	11
GC content	29%
IMG OID	642565607
Product	glycosy hydrolase family protein
Protein accession	YP_698373
Protein GI	110802276
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3525] N-acetyl-beta-hexosaminidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0315037
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATTTAA TACCAAGACC AAAAAGTGTA ATTAATCATG AAGGTGAATT TTTTATAGAA 
AGAGATACTG AAATTATATT AAGTAGTGAA TTATCCTTTG AAGATTTAAA TTTGGCAATT 
ATGACTCAAA AGGAAATAGA AAAAGTATTA GATTTTAAAC TTAACATAAA TAAACTTTTT 
ATGGATAAGA AATATAGTAA CTCAATAATT TTAAGAGAAT TTAAATTTGA AAATGAAGAG 
GAATATAAAA TAGAAATAAA AGAGAATCAG GTAATAATAG AAGGGTTTGG TGCTGGATTA 
TTCTATGGAT GTCAGAGTTT TAGACAACTT GTAAGAGAGT TTGGAGCATG TATTCCAAAT 
CTAATAATAG AAGATTCTCC ATATTTTAAA TATCGTGGAT TTTATCATGA TGTAACAAGG 
GGAATGGTAC CAACCTTAGA TACATTAAAA AGATTAGTTG ATAAGGCAGC TTTTTATAAA 
ATAAATCAGT TGCAACTATA TATAGAGCAT ACCTTTGCTT TTAAGGGAAT GAGCGAAGTT 
TGGATGGATA AGGATCCTTT AACAGCAGAG GAAATATTGA TTTTAGACAA GTATTGCAAA 
GAAAGACATG TGGAACTTGT ACCATCATTA TCAACCTTTG GTCATCTATA TGAAGCTTTA 
AGAAGTAAAT CCTTTAGAGA ACTTTGTGAA TTAGAAATAG GAGATGAAGA ATATTCTTTT 
GTAGATAGAA TGGCACATCA TACTTTAGAT GTTACTAATC CTAAAAGTTT AGGCTTTGTT 
GAATCAATGC TTTTAGAATT TATTCCTTTA TTCAGTTCAG ATAAGTTTAA TATTTGCTGT 
GATGAAACCT TTGATTTAGG AAAAGGAAAG AGTAGAGAGA AGGCTGAAAA ATTAGGAGTA 
GGTAAAATAT ATACAGAGTT TTTAAATAAG GTATACAACA TTGTAAAAAG GTTCAATAAA 
AATGTTATGT TCTGGGGAGA TATAATAGTT GGATATCCAG AGCTTTTAAG TGATATACCA 
GAGGATTTAA CTTGTTTAAC TTGGAACTAT CATCCACAGG CTAATGATGT AGCCACAAAA 
ATTATAGCAG AGAACAATAA AGTACAATAT GTTTGCCCTG GTGTAGGTGG ATGGAATATG 
ATGATGAATC TTATAGAAGG CTCTTTTAGT AATATAAGAA GAATGGTTAA CCATGGAATG 
AAATATGGAG CTATAGGTGT TTTAAATACA AACTGGGGAG ACTATGGAAA TATAAATCTA 
TTAGCTAATT CAATGCCATC TATGATTTAT GGAGCAGGAA TTTCATGGAA TCCAAAGGAA 
GAGGAGTTTA ATGAAATTTT TAAGTCTATA TCCCTTATGG AATTTGGTGA TGAATCTATG 
AAGGTGGTTT CTTTAATGGA TAAGCTTTCT AAAAATCAAG TTGCAGGTTG GGGAGAACTT 
GTTAGATGGA AAGAAAAGTT TAATGAAAGA GAAGAAACTA AGGAAGAAAT TAAGAATATA 
GATACTTTAA AAGTTTTTGA AGGATATAAG GTTGCTTCAG AGGTAAGAAG AGAGTTTATT 
AAATTACTTA AAAATACAGA GGATAAAGAA GCTATTCAAA GCTTTATTGT GTCTTCAAAG 
GGATGGGAGC TTATAGATAA ATTCTTCATG GTATTACTTG AAAGAGAGTT TAATAAAAAA 
AGTTTATTAG ATATAGATAA AAAAGACTTA GCTAAGGATT TAGAGCTTTG GTTTTATGAT 
TACACATCAA TATGGAGAAA ATATAATAAA GAAAGCGAGC TTAATAGAAT AAGAGAAGTT 
ATAGTATATA TGTGCTCATA TTTAAGGGGT TAA

Protein sequence

MHLIPRPKSV INHEGEFFIE RDTEIILSSE LSFEDLNLAI MTQKEIEKVL DFKLNINKLF 
MDKKYSNSII LREFKFENEE EYKIEIKENQ VIIEGFGAGL FYGCQSFRQL VREFGACIPN 
LIIEDSPYFK YRGFYHDVTR GMVPTLDTLK RLVDKAAFYK INQLQLYIEH TFAFKGMSEV 
WMDKDPLTAE EILILDKYCK ERHVELVPSL STFGHLYEAL RSKSFRELCE LEIGDEEYSF 
VDRMAHHTLD VTNPKSLGFV ESMLLEFIPL FSSDKFNICC DETFDLGKGK SREKAEKLGV 
GKIYTEFLNK VYNIVKRFNK NVMFWGDIIV GYPELLSDIP EDLTCLTWNY HPQANDVATK 
IIAENNKVQY VCPGVGGWNM MMNLIEGSFS NIRRMVNHGM KYGAIGVLNT NWGDYGNINL 
LANSMPSMIY GAGISWNPKE EEFNEIFKSI SLMEFGDESM KVVSLMDKLS KNQVAGWGEL 
VRWKEKFNER EETKEEIKNI DTLKVFEGYK VASEVRREFI KLLKNTEDKE AIQSFIVSSK 
GWELIDKFFM VLLEREFNKK SLLDIDKKDL AKDLELWFYD YTSIWRKYNK ESELNRIREV 
IVYMCSYLRG