Gene CPR_0084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_0084
Symbol
ID	4204178
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	99856
End bp	101676
Gene Length	1821 bp
Protein Length	606 aa
Translation table	11
GC content	29%
IMG OID	642564633
Product	pullulanase
Protein accession	YP_697423
Protein GI	110802434
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAAAG TTTATATTTA TCATGATTCT CAAGGTACCT TTTATAGGGA ACCTTTTGGA 
GCAGTTTCTG TAGGTTCTAA GGTAAGTTTA AGATTAGAAT GCAAAGAGTG TGGAGAAGTT 
TTTATAGAGG TAATAAAGTT TGATGGAAGT AGATATTTAA TACCTATGAC AATTGAAGAG 
AGAAGAAATG AATGCATAAT TTATAAAGGA ATAATAGACA CTACAAACTC CTTAGGAGTA 
ATAAATTATT ACTTTAAATA CATTAAGGAT GGATTTACTA AGTATTATGG AAATAATGAT 
GAGTGTTTAG GAGGAGAGGG AAAGATATAC TATGATTTTC CTAATTATTA TCAAATAACA 
GTTTATGAGG ATAATAAAAT TCCTAGTTGG TATAAGGAAG GTATTATTTA TCAGATATTT 
GTGGATAGAT TTTTTAATGG AAATAAGGAT AGTATGATAT TAAATAAAAA GAAAAATAGC 
TTTATATATG GTAATTGGTA TGATGAGCCA ATGTATATAA GAGATAGTAA TGGAAATATT 
AAACGGTGGG ATTTTTATGG AGGGAATTTA AGGGGAGTAA TTGAAAAATT AGATTATATA 
AAATCTTTAG GGGTAAATAT TATATACATG AATCCAATCT TTGATGCTGT GAGTTGTCAT 
AAATATGATA CTGGAGATTA TGAAAATATT GATAAGATGT ACGGAACTAA CAGTGATTTT 
AATGAATTGT GCCAAAAAGC TGAGGAAAAA GGTATAAGGA TAATATTAGA TGGAGTTTTT 
AGTCATACAG GATCAGATAG TAGGTACTTT AATAAATACG GAAACTATGG AGAGCTGGGA 
GCCTATGAAT CTAAATACTC TAAATATTAT AATTGGTATA GGTTTTATGA TTATCCTAAT 
AGTTATGAAT GTTGGTGGGG TTTTGAAAAC CAGCCTAATG TAGAGGAATT AGAAAAGACA 
TATTCAGATT ATATAGTTAA TAGTGAAAAT TCAATAATAG CGAAGTGGCT TAGATTAGGA 
GCAAGCGGAT GGAGGTTAGA TGTAGCAGAT GAACTTCCAG ATGAATTCAT ACAAATGATT 
AAGGAAAGGA TGAAAAATGA GAAAGAAGAT AGTGTGCTTA TAGGAGAGGT TTGGGAAGAC 
GCTTCAAATA AGGTTAGCTA TTCAAAAAGA AGAAAGTATT TATTAGGAAA TGAATTAGAT 
TCTGTAACAA ATTACCCTTA TAGAGATATA ATTTCTAATT TTTTAAATGA AGAAATAAGT 
TCAAAGGATT TTTATAAAGT AATAATGAGC ATAAAAGAAA ATTATCCAAG AGAAAATTTT 
TTTGCAAACA TGAATATTCT AGGTAACCAT GACACAGAAA GAATACTTAC AGTATTAAAA 
GAGAATTTAA ATAAGTTAAA ATTAGCCCTA TGTCTTCAAA TGACTTTACC TGGAGTTCCC 
TTAATTTATT ATGGTGATGA GGCAGGACTT TTAGGAAATA AGGATCCTGA AAATAGAAAG 
ACCTATCCTT GGGGACGAGA AAATAAGGAA ATATTAAGTT ATTATAGTTT TTTCGGAAAC 
TTTAGAAAGA ATGAAGAGGT TTTAAGAAAG GGAGATTTTT ATATTTTTAA GGATACACCT 
GAGGATATCA TTGCTTTTAA GAGAGTTTAT AAAGATAAAG AAATGATAAT TATAGTAAAC 
AGGAGTAATT CTAGAAAAAC CATAACCTTA GATAGCGAGA AAAGAAGATA TAAAGATAAA 
TTTTCTAAGG AAGAATTTTA TGGTGATGGT AGCATTACTT TAGAGGTAGA AAGAGAAAAT 
TATAAAATTT TAACTAATTA G

Protein sequence

MGKVYIYHDS QGTFYREPFG AVSVGSKVSL RLECKECGEV FIEVIKFDGS RYLIPMTIEE 
RRNECIIYKG IIDTTNSLGV INYYFKYIKD GFTKYYGNND ECLGGEGKIY YDFPNYYQIT 
VYEDNKIPSW YKEGIIYQIF VDRFFNGNKD SMILNKKKNS FIYGNWYDEP MYIRDSNGNI 
KRWDFYGGNL RGVIEKLDYI KSLGVNIIYM NPIFDAVSCH KYDTGDYENI DKMYGTNSDF 
NELCQKAEEK GIRIILDGVF SHTGSDSRYF NKYGNYGELG AYESKYSKYY NWYRFYDYPN 
SYECWWGFEN QPNVEELEKT YSDYIVNSEN SIIAKWLRLG ASGWRLDVAD ELPDEFIQMI 
KERMKNEKED SVLIGEVWED ASNKVSYSKR RKYLLGNELD SVTNYPYRDI ISNFLNEEIS 
SKDFYKVIMS IKENYPRENF FANMNILGNH DTERILTVLK ENLNKLKLAL CLQMTLPGVP 
LIYYGDEAGL LGNKDPENRK TYPWGRENKE ILSYYSFFGN FRKNEEVLRK GDFYIFKDTP 
EDIIAFKRVY KDKEMIIIVN RSNSRKTITL DSEKRRYKDK FSKEEFYGDG SITLEVEREN 
YKILTN