Gene CPF_0908 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0908
Symbol
ID	4203357
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1070550
End bp	1072190
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	24%
IMG OID	638081790
Product	EAL domain-containing protein
Protein accession	YP_695357
Protein GI	110800502
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain [COG2200] FOG: EAL domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00157995
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA GGGTGTTTTG GGTAAGTATA GTATTTTTAA TAATTATAAC GGTTTTAGGT 
ATTACAATTA AATTTGATGG TAAGAAAGTT AATTGTAACA GAAAAACAGT TAAAGTAGGA 
TTTTATGAAT ATTATCCTTA TTATTATCTT AATAAAAATT CTATGCCAGA TGGCTATTAT 
AATGAAATAC TAGAATTAAT ATGTAATAAG TTAGATTTAA ATTATAAGTA TGTAGATTGT 
AATGTAACAG ATGCTTTAGA AAAGCTTAAA TCTGGACAGA TAGATTTAGT CTTTGGAATA 
AGTAAGACTC CTGATAGAGA AAAGGAATAT GAATTTACTG ACCACTATCT AAATAATGAT 
AACTTTGCCA TATATACTAA TAAGAATATA AAAAATGGTG ATTTAAAAGC TTTAAATGGA 
TTAAAAATGG GATTTTTAAA AGGAGAAGAA AATAATGAGT GGATTTTAAG GCTTTTAAAG 
GATAAAGGCA TAAATGTGAA ACCTATAGAT GTTTCTAATT ATCCTGAAGA TGAGGAATAT 
TTGTATAATA ATAAAGTGGA CTTTGTAGTA GAAAATACAA GAAGCAATAT AAATTATGAA 
AATAAAAATA TTAAAAAGAT TTTTGAATTT TCTTCTGGAC CAGTTTATAT AGTTAGTAGA 
AAAGGTAATG AAAAATTAAT TGAAGGAATA GATTCTGTCC TTGGAGAGCT TGAGGAAGAT 
GAGGAACAAA AAGATATTAA TTTATATTCT AAGTATTTTG ATGAGCATTT AGATAAATTA 
AAAAATGAGA AATTACTAGT TGTAATATTT TTAATTATAA TATCATTATT TATTTATAAA 
AAAAGAAAAA ATAAAATATT CGCTATAAGA ACTAAAAGAA AAATTAGAGA CTATATTAAA 
AATGATAAAT ATATATTATA TTATCAACCT ATAGTAGATC CAAAGAAAAA TAGAGTAAAG 
GGATTTGAAT CTCTTTTGAG ATTAAATAAG GATGGAAAAA TTTTAACTCC CTATAGCTTT 
ATAAAGGAAA TTGAAGACAA TAATATGTCT TTAGAGGTTT CTTTATGGCT TTTAAAGAAG 
GTTATTTTAG ATTACAGAAT AATAAAAGAT TATGATATGG TTAAAGGAAG AGATTTTTAT 
ATATCCTTAA ATGTTTCATT TAAAGAAATA GAAAATCCTA AGTTTTTAAG ATCCTTAATG 
AAAATTGCAA AAGATTATAA GATTGATGAT TGTAATATTT GTTTAGAGAT AGTAGAAAAG 
TTTGGTATGG AGGATATAGG AAGAATACAA AGTGCAATAA GAATAATAAA GGAATATGGA 
TTTTTAATAG CTATAGACGA TTTTGGAGTG GAATATTCTA ATTTAGATTT ATTAAATAAA 
ATTGATTCTG ATATAGTGAA GCTAGACAAG TACTTTGCTG ATAATTTAGA CAAGTCTATT 
ATAAATGAAA AAACAGTGGA ATTTATATCA GAAATATGTA TCATAGCTAA TAGAACTATA 
GTATTTGAAG GGATAGAGGA ACAGTATCAG GTTGACATTG TTAAGGCATT TCCATATGAA 
AAAATATATA TTCAGGGATA TTTCTATTCA AAGCCAGTAG ATATTGAGAA TTTAAAGGAT 
TTTAAATTTA AGGATAGTTA A

Protein sequence

MKKRVFWVSI VFLIIITVLG ITIKFDGKKV NCNRKTVKVG FYEYYPYYYL NKNSMPDGYY 
NEILELICNK LDLNYKYVDC NVTDALEKLK SGQIDLVFGI SKTPDREKEY EFTDHYLNND 
NFAIYTNKNI KNGDLKALNG LKMGFLKGEE NNEWILRLLK DKGINVKPID VSNYPEDEEY 
LYNNKVDFVV ENTRSNINYE NKNIKKIFEF SSGPVYIVSR KGNEKLIEGI DSVLGELEED 
EEQKDINLYS KYFDEHLDKL KNEKLLVVIF LIIISLFIYK KRKNKIFAIR TKRKIRDYIK 
NDKYILYYQP IVDPKKNRVK GFESLLRLNK DGKILTPYSF IKEIEDNNMS LEVSLWLLKK 
VILDYRIIKD YDMVKGRDFY ISLNVSFKEI ENPKFLRSLM KIAKDYKIDD CNICLEIVEK 
FGMEDIGRIQ SAIRIIKEYG FLIAIDDFGV EYSNLDLLNK IDSDIVKLDK YFADNLDKSI 
INEKTVEFIS EICIIANRTI VFEGIEEQYQ VDIVKAFPYE KIYIQGYFYS KPVDIENLKD 
FKFKDS