Gene CPF_0421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0421
Symbol
ID	4201891
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	503188
End bp	504852
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	31%
IMG OID	638081305
Product	putative oligo-1,6-glucosidase
Protein accession	YP_694878
Protein GI	110798775
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.591118
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAAA AGTGGTGGAA AGAATTAATT GCTTACCAGA TTTATCCTAA GAGCTTTATG 
GATTCTAATG GTGATGGTAT AGGTGATATT CAAGGGATAA TATCTAAATT AGATTATTTA 
AAAGATTTAG GTATTGATTT AATCTGGCTA TGTCCAATGT ATAAATCACC AAATCATGAT 
AATGGTTATG ACATTAGTGA TTATAAAGAT ATCTTAGATG AATTTGGAAC TATGGATGAT 
TTTAATGAAT TGCTTAGTGA GGTTCATAAT AGAGGGATGA AACTTATTAT AGATTTAGTA 
ATAAATCATA CTAGTCATGA ACATCCATGG TTTATAGAAT CAAGAGCTTC TAGGGATAAT 
CCTAAAAGAG ATTGGTATAT TTGGAGAGAA GGTAAAGGGG ATGAGGAACC AAATAACTGG 
GAAAGTATAT TTAAAGGTTC AGCTTGGGAA TTCTGTGAGA ATAGTGAAGA GTATTACCTG 
CATTTATTTG CTAAAGAGCA ACCAGATTTA AACTGGGAGA ATAAAGAGGT AAGAAATGAA 
CTATATAAGA TGATAAACTG GTGGCTTGAT AAGGGTATTG ATGGGTTTAG AGTTGATGCC 
ATAAGTCACA TAAAAAAAGA AGAGGGTCTT AAGGATATGG ATAATCCAGA GGGACTTAAA 
TATGTTTCAT CCTTTGAAAA ACATATGAAT GTAGAGGGAA TAAATTCTCA TCTTAAGGAA 
CTAAAAGAAG AAACTTTTTC AAAGTACGAT ATAGTTACCG TTGGAGAAGC AAATGGAGTT 
AGTGCCAATG AAGCTGATCA CTGGGTAGCT GAAGATGAGG GGACATTTAA TATGATATTC 
CAATTTGAGC ATCTTAATCT TTGGAATTAT GAAGAGGGAC AAGGATTTGA TGTGAAGGCA 
TACAAAGATG TTTTAACAAA TTGGCAAAAT TCTTTAGAAG GTAAAGGATG GAATGCACTT 
TTCATTGAAA ATCATGATAT ACCTAGAGTT GTTTCAACTT GGGGAAATGA CAAGGAATAT 
TTAACTGAAT GTGCAAAAGC TTTTGGAGCA ATTTATTTCT TACAAAAGGG AACCCCTTTC 
ATATACCAAG GGCAAGAACT TGGTATGACA AATGTTAAAT ATCATAGCAT ATCTGAGTAT 
GATGATGTTA AAACTATAAA TACTTACAAT GAAAGAATTG AAAGTGGTGT TTCAGAGGAA 
ATAGCATTAA AAGAAGCTTG GGTAACTTCA AGAGATAATT CAAGAACACC TATGCAATGG 
AATTCAAGTG AGAATGCAGG GTTTACTTGT GGAAAACCTT GGATAGGAGT TAATGAAAAT 
TATAAAACAA TAAATGTAGA AGTTGAAGAA AGGGATGAAA ATTCAGTTTT AAACTTCTAT 
AAAAAGCTTA TAAAACTTAA AAAGTCTAAT GAAGCTTTAA TCTATGGTGT ATATGATTTA 
ATCCTTGAAG AGGATGAAAA TATCTTTGCT TATACAAGAA CTTTAAATAA TGAAAAGTTC 
TTGATAATGG CTAATTTAAC TGGAGAAAAT GCCAAGTACA TGTATGAGAA AGAAAAACTT 
AATTCTAAGG ATTTAATTCT TAACAATTAT GAGGTTTGTG AACATAAAAA CTTAACAGAG 
TTTACATTAA AACCTTATGA ATGCAGAGTA TATAAGCTTT CTTAA

Protein sequence

MNKKWWKELI AYQIYPKSFM DSNGDGIGDI QGIISKLDYL KDLGIDLIWL CPMYKSPNHD 
NGYDISDYKD ILDEFGTMDD FNELLSEVHN RGMKLIIDLV INHTSHEHPW FIESRASRDN 
PKRDWYIWRE GKGDEEPNNW ESIFKGSAWE FCENSEEYYL HLFAKEQPDL NWENKEVRNE 
LYKMINWWLD KGIDGFRVDA ISHIKKEEGL KDMDNPEGLK YVSSFEKHMN VEGINSHLKE 
LKEETFSKYD IVTVGEANGV SANEADHWVA EDEGTFNMIF QFEHLNLWNY EEGQGFDVKA 
YKDVLTNWQN SLEGKGWNAL FIENHDIPRV VSTWGNDKEY LTECAKAFGA IYFLQKGTPF 
IYQGQELGMT NVKYHSISEY DDVKTINTYN ERIESGVSEE IALKEAWVTS RDNSRTPMQW 
NSSENAGFTC GKPWIGVNEN YKTINVEVEE RDENSVLNFY KKLIKLKKSN EALIYGVYDL 
ILEEDENIFA YTRTLNNEKF LIMANLTGEN AKYMYEKEKL NSKDLILNNY EVCEHKNLTE 
FTLKPYECRV YKLS