Gene CPF_0652 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0652
Symbol
ID	4202913
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	781031
End bp	782341
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	25%
IMG OID	638081537
Product	F5/8 type C domain-containing protein
Protein accession	YP_695105
Protein GI	110799173
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3669] Alpha-L-fucosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0313432
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACAA CTCTAGTAAA CCTAACTCCA ACTAAAGAAC AAAGAAAATA CCAAGAAGAT 
GAACTAATAG CTTTTTTAGA CCTCCAAATG AATACATTTA CAGCTAATTC TGAAAATAAT 
GATGAGGCTC CTTCTTTATT AAAAAAAGAG ACTTCATTTA ACACAGATAT ATGGATAGAA 
AATCTATTTA AATTTGGATT TAAGAAAGTT ATTTTAACTG CTAAGCTTAA TAATGGTATT 
TGTTTATGGC AAAGCAATTG TTCAAAGGTT AATATAAATA CTTTTTCTTT AGAGAATAAT 
TATGATGATT TAGTAAAAAA AGTTAGTAAA TCTTGTAAAA AGTTTGGACT TAAATTTGGT 
ATTCATCTTA CTTTAAAAGA TTATCTCACT TTAAACTTAA CTCCTGAAGA ATATGATAAT 
TACTACACGT CTCAATTAAA AGAACTTATG ACTAATTATT CACAAATAAG TGAAGTTATT 
ATGGATATGA CCTCTTTAGA TGAATATTAT GACTCCCTTG ATTTTGAAAG ATACTTTAAA 
GTAGTTAAAG AAATAAATCC TAAATGTATG ATATCTAGCC CTATTGGACC TGATGTACGT 
TGGACATATT ATTCTGATAT AGAGTCATCT AAAAACTATT TCTACTCTTC TATAAATTTA 
GATCTTTTAA AAGAAGATTT TAACAACGAA GAGATTAGAA AAGGAAATAT TTATGGAGAC 
ACTTGGATTG TTGGAGAAAG TATTTACTCT CTATCTGACT GCTTAAACCA TAATAAAGAT 
TCATTATCAA ATTTAAAACA TGTGTATAAT AATTCATTAG GAAGAAATAC AAACTTGGTA 
TTAGTTTTAT CTCCTAATAC AGATGGATTA TTAAATCATA ATGAATTAAG TTTACTTTCT 
GATTTTTCTA AATATATAAA AGAAACTTTT TCTAATAATC TTATTAAGGG CTCTTCTATA 
TTAGCTACAA ATTCATCTTC TAGCGATAGC TATAATTTAA TTGATGACTA CAAAAAATCT 
TATTGGATAG CTAATGAAAA TGCTGTTAAC CCTTATATAG AGATAGATTT TAAAACTATC 
ACTGAATTTA ATATTTTAGA AATTAGAGAG TGGATTGCTG AAGGTCAAAA CGTAGAAGAA 
TTTAAAGTTT ATGCATATAA CAATGGTTGG TTTGAACTTT ATAATGGTAC TTCTATTGGA 
TATAGACATA TAGCAAAACT TAATAATATC AAAACTGATA AAATTAAAAT TTCATTTACT 
AAATATAAAA ACCCACCTAT GATTAATCAT ATTGGTGCAT ATTTAGGATA A

Protein sequence

MNTTLVNLTP TKEQRKYQED ELIAFLDLQM NTFTANSENN DEAPSLLKKE TSFNTDIWIE 
NLFKFGFKKV ILTAKLNNGI CLWQSNCSKV NINTFSLENN YDDLVKKVSK SCKKFGLKFG 
IHLTLKDYLT LNLTPEEYDN YYTSQLKELM TNYSQISEVI MDMTSLDEYY DSLDFERYFK 
VVKEINPKCM ISSPIGPDVR WTYYSDIESS KNYFYSSINL DLLKEDFNNE EIRKGNIYGD 
TWIVGESIYS LSDCLNHNKD SLSNLKHVYN NSLGRNTNLV LVLSPNTDGL LNHNELSLLS 
DFSKYIKETF SNNLIKGSSI LATNSSSSDS YNLIDDYKKS YWIANENAVN PYIEIDFKTI 
TEFNILEIRE WIAEGQNVEE FKVYAYNNGW FELYNGTSIG YRHIAKLNNI KTDKIKISFT 
KYKNPPMINH IGAYLG