Gene CPF_0266 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0266
Symbol
ID	4201033
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	321668
End bp	322903
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	28%
IMG OID	638081153
Product	glycosyl transferase, group 1 family protein
Protein accession	YP_694727
Protein GI	110801173
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTTAA AAAGAAGTTT AAAAAATTTA TTAAGACCTA TATTGAAGCC AATGTTGCTT 
AAATATAGAG AAAAAGGACA TGAAGATCAA AAACAAGTAT TCTTTGATGA AATAACTGGT 
GCAATAAAGA ATGGAAATTA TGATGCTATA GTTATATTTG ATGTTTACTT TGGATTTGAG 
GTTAAAATGT TCCAAAGACC TCAACATATA GCTTTAAACC TAGCTAAGGA AAATGTTTTA 
TATTTTTATA AAGCATCACC TTATGTTGAT AAGGATATTA AAACTTACAA GAAGATGGAA 
GAAAATCTTT ATCTAGTTAA CACAGATCTA TATTGGTTAC AAGAATGTTT AATAGATATA 
GTATCTCAAA GTGGAGTTCC TGCTTTTGGT CAAATATATT CAACTTCATT TGTTGAATAT 
GACAGTTGGT TAAAGAAATT TACAGATAGA AACTTTAAAA TAATATATGA ATATGTTGAT 
GATTTATCAG ATGATATTGC TGGATTTAAA ATATCAGATG AAATTAAAGC AAGTCATAAG 
AGAATGCTTG AAGATACAGA AAAAGTTTAT GTGGTAACTA CTGCAGATAA GCTTTATCAA 
GAAGCTAAAG AGTTAAGAGG AGAAAATAAA TTAGCTCTTG TAACTAATGG AGTTCAATAT 
GAGCATTTTG CTAATATTGA TTGCAAAAAG ATTCCTGATA AGATGAAAAA TATTGTTAAT 
AGTAAGAAAA AGATAATAGG ATATTTTGGA GCCTTAGCTA GTTGGTTTGA TTATGATTTA 
ATTAAAGAGC TTGCAGAAGA ATTTAAGGAT GATTATGAAA TAGTTCTTAT AGGAATAGAT 
TATGATCAAT CCTTAGGAAA GAGCGGAATA TTAAAATTAG ACAATGTTCA TTATTTAGGA 
ACTGTTAACT ATAATGAACT TCCAACATAT TCTAAGTTCT TTAATGTTTC TATAATTCCT 
TTTGTGGTAA ATGAAATAAC AGAAGCTACT TCACCAGTAA AATTATTTGA ATATATGGCT 
TTAGGTAAGC CTATAGTTAC AACAGCTTTA CCAGAGTGTA GAAAATATGA ATCACCTTTA 
GTAAGTGATT CACATGAAGA TTTCATAAAT AACATTAAGA AAGCTGCTGA GTTAGAGAAT 
TCTAAGGAAT ATATAGAATT ACTTAGAAAA GAAGGTAATC AAAATACTTG GAGACAAAAG 
GCAAAGGACA TTAAGGAGCT TATACTAAAC TCTTAA

Protein sequence

MSLKRSLKNL LRPILKPMLL KYREKGHEDQ KQVFFDEITG AIKNGNYDAI VIFDVYFGFE 
VKMFQRPQHI ALNLAKENVL YFYKASPYVD KDIKTYKKME ENLYLVNTDL YWLQECLIDI 
VSQSGVPAFG QIYSTSFVEY DSWLKKFTDR NFKIIYEYVD DLSDDIAGFK ISDEIKASHK 
RMLEDTEKVY VVTTADKLYQ EAKELRGENK LALVTNGVQY EHFANIDCKK IPDKMKNIVN 
SKKKIIGYFG ALASWFDYDL IKELAEEFKD DYEIVLIGID YDQSLGKSGI LKLDNVHYLG 
TVNYNELPTY SKFFNVSIIP FVVNEITEAT SPVKLFEYMA LGKPIVTTAL PECRKYESPL 
VSDSHEDFIN NIKKAAELEN SKEYIELLRK EGNQNTWRQK AKDIKELILN S