Gene CPR_0908 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_0908
Symbol
ID	4204326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	1040354
End bp	1041709
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	28%
IMG OID	642565466
Product	sucrose-6-phosphate hydrolase e1
Protein accession	YP_698232
Protein GI	110801477
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1621] Beta-fructosidases (levanase/invertase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.106564
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAGAC CTAAATTACA TTTCACATCA CCTAAAAATT GGATAAATGA TCCTAACGGA 
TTTATATATT ATAAAGGAGA ATATCATTTA TACTATCAAT ACTTCCCATA TGCTGCAGAG 
TGGGGAACTA CACATTGGGG ACACGCAACT AGTAAGGATT TAGTAAATTT TGAACATCAC 
GGTATTGCAT TATTCCCAAG TAAGAAATTT GACAGTAACG GATGTTTCTC AGGAACAGCA 
TTAATAGAAG ATGATAAACT ACAATTTTAT TATACTGGAA TTAAATATTT AAGGACTGAA 
GATGAAAATA TTCATAAACC ATATGATAAT GAATCATTTG AAGCGTGCCA AGTGAAAATA 
GAAAGTAAGG ATGGATATAC ATTTGATAAC TTTAATGATA AAAAAGTTGT TATTCCACCT 
ATAACTGATA GAAAATTAGG TAATAAAACT CATACAAGAG ATCCAAAGGT TTGGAAATAT 
AAAGATGGAT ATTCAATGAT AGTTGGAAGT AAGTTTGAAA AAGAAGGTGT AGAAGGATAT 
ATAGGACAGG CTCTTTTCTA CACAAGTAAG GACGGAGAAT CTTGGGAATA CAAAAACCGT 
TGCTACGATG AAAGTATAGG TGATATGTGG GAATGTCCAG ATTTAGTTAA TGTAGATGGA 
AAATATATTT TAATTATATC TCCTGAACAT ATAACAAATG ATGGGATAAA CTATACAAAT 
AATTCTATTT ACTCAATTGT AGATTTTGAT GAAGAAACTT GTGAAATGAA AATAACAAAT 
GGATATAGTT ATTTAGATGA AGGGCTTGAT GTTTATGCAC CTCAAACAAC TTTAGACAAA 
GATGGAAACA GAATTTTAAT TGGCTGGGTT CGTATGCCTA AGAAGTTTGA AGGTGAAGAA 
TGGATAGGTA TGATGACTCT TCCAAGAGTA ATAAATGTAA TAGATAATAA AGTACATTTT 
GCAGTTGCAG AAAATATACA AAACTTATTT ACAAAAGAAA TAAATAGATC AGATTTTGAT 
ATTAATAATC CATGCAGAAT AAAAGTAAAG CTAAACAAAG AAAGTCATAT AAATATTGGA 
GGATACAAAA TATGTGTAGA AGATGATAGC ATAGCAGTTG ATAGAAGCAG TGTGTTTGTA 
GAAACTGATT TTAAAGCAGT AAAATTTAAA TCATCTAAAT TAGATGGAAT ATATGAGTTA 
GACATATTTG TAGATAACGG AATAATTGAA ATCTTTATAA ATGGTGGAAA GTATGTAATT 
ACAAATGTAG TATACAATAT GCAATCATAC ATTAAATATG ATAATATTAA TGAATTGGAA 
ATATTTGAGA TAAATAATCC TGATATTATT TTATAA

Protein sequence

MRRPKLHFTS PKNWINDPNG FIYYKGEYHL YYQYFPYAAE WGTTHWGHAT SKDLVNFEHH 
GIALFPSKKF DSNGCFSGTA LIEDDKLQFY YTGIKYLRTE DENIHKPYDN ESFEACQVKI 
ESKDGYTFDN FNDKKVVIPP ITDRKLGNKT HTRDPKVWKY KDGYSMIVGS KFEKEGVEGY 
IGQALFYTSK DGESWEYKNR CYDESIGDMW ECPDLVNVDG KYILIISPEH ITNDGINYTN 
NSIYSIVDFD EETCEMKITN GYSYLDEGLD VYAPQTTLDK DGNRILIGWV RMPKKFEGEE 
WIGMMTLPRV INVIDNKVHF AVAENIQNLF TKEINRSDFD INNPCRIKVK LNKESHINIG 
GYKICVEDDS IAVDRSSVFV ETDFKAVKFK SSKLDGIYEL DIFVDNGIIE IFINGGKYVI 
TNVVYNMQSY IKYDNINELE IFEINNPDII L