Gene CPF_1064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1064
Symbol
ID	4203119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1210835
End bp	1212460
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	23%
IMG OID	638081945
Product	EAL domain-containing protein
Protein accession	YP_695510
Protein GI	110801198
COG category	[T] Signal transduction mechanisms
COG ID	[COG2200] FOG: EAL domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0102515
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA GTAAGAGGTT TATAATGATT ATCCTCTTTT TTCTTGTATT TATAATGTTA 
TGTTTATGCT ATGGATCAAT TATAAATAAA GAAAAAAGAA AAACCTTATT AAAAATTGGA 
TTTTATGATG ACTATCCTCA TTTTTATATT AATAATAAAG CAAATGTTTG TGGATATTAT 
AAGGATATAA CTGAAAATTT AGCTAAAAAA CTTAATTTTA AGGTAGAATA TGTAAATGGA 
AATGTGCCAG ATCTTTTAAA AGAACTTAAA AACGGAGAAA TAGATTTAGT ATTTGGAATA 
AATAAGCTTC CAGCGAGAGA AGAATCCTTT AAGTTTACAA ATAAATCTAT AAATGATGAG 
CTGAATTTTA TATATACAAA TAAGAATATA AAATATGGTG ATTTAGAAGC TTTAAATGGT 
ATGAAAATGG GATATATAGA GGGTGAATTA GATAATGAAT GGATATTAGA TTATCTAAAA 
AAAAGAAATA TAAATGTTGA ACTAGTTAAT GGATCTTCTT ATAAAGCAGT AAAGACTTTA 
TTAATTCATA ATAAAGTAGA TTTTATTGTG GATAATCCAG ATAGTGATAT AAAAAATAAA 
GGAAAAAATA TTAAAGAAGT TTTTGAATTT TCATCTGGAG AAAAATATAT TGTAGCAAAT 
AAGAATAATA AAGAGTTAAT AAAAAAAATT GATGGAGCGC TTAGTACAAT TAATCTTAAT 
GCATATCTTG GTAATAATCC TTATTTTAAA AAAATTGATA ACTTTATTAT TGATACTACT 
AATAAGAATG TAGTTATTTT AATTCTTTTT ATTATATGTA TAATTATGTT CAAGAAGGTT 
AAAAAGAGAA TAGTTAAAAT ATTTAAAAAG AAAAAAATAT ATAATGATCT AAAAAAAGAC 
AATTATACTT TGTATTATCA ACCAATAGTG GATTTTAAAC ATAATAGAGT AAGAAGCGTT 
GAGGCTTTAT TGCGTTTAAG AAAAGATGGC AAATTACTAA CTCCATATCA TTTTATGAAG 
GATATAGAAG ACGCCAATAT GATGAAAGAA ATTACATTGT GGGTCTTAAA GAGGGTAATT 
AAAGATTATA ATATTATAAG GTGTTACGAC AATATCAATG AAAAAGATTT TTATATTTCT 
CTAAATGTAT CTTTTAATGA GATAAAAGAT AGAGAGTTTT TAAAGAAAAT AGTGAAAATA 
GTTAATGATA ACAAAATAAT AAAAAATAGT ATTTGTCTAG AGATTATAGA AAAGTTTGGA 
GTAGAGGAAA TAGAAAAAAT ACAAGAAAAC ATCAAGTTTT TACAGGATAA TGGTATTTTA 
ATCGCAATAG ATGACTTTGG TGTGGAGTAC TCAAATTTAG ATTTATTAAA GAAAATAGAT 
TCTAATATTA TTAAATTAGA TAAGTTTTTT GCAGATGGAA TTAATGATTC AGAAATAAGC 
CTTAAAGTAA TAGACTTTAT ATTAGATATA TGTAGATTAT CAGATAAGTC TATAGTTATT 
GAGGGGATAG AGGAAAAAGA GCAGGTTGAT ATAATAAAAA CCTTTCTTTA TGAAAAAATT 
TATATTCAAG GATATTATTT CTCAAAGCCA TTAGATATTA AAAGTTTAAA AGCTTATACC 
TTTTAG

Protein sequence

MKKSKRFIMI ILFFLVFIML CLCYGSIINK EKRKTLLKIG FYDDYPHFYI NNKANVCGYY 
KDITENLAKK LNFKVEYVNG NVPDLLKELK NGEIDLVFGI NKLPAREESF KFTNKSINDE 
LNFIYTNKNI KYGDLEALNG MKMGYIEGEL DNEWILDYLK KRNINVELVN GSSYKAVKTL 
LIHNKVDFIV DNPDSDIKNK GKNIKEVFEF SSGEKYIVAN KNNKELIKKI DGALSTINLN 
AYLGNNPYFK KIDNFIIDTT NKNVVILILF IICIIMFKKV KKRIVKIFKK KKIYNDLKKD 
NYTLYYQPIV DFKHNRVRSV EALLRLRKDG KLLTPYHFMK DIEDANMMKE ITLWVLKRVI 
KDYNIIRCYD NINEKDFYIS LNVSFNEIKD REFLKKIVKI VNDNKIIKNS ICLEIIEKFG 
VEEIEKIQEN IKFLQDNGIL IAIDDFGVEY SNLDLLKKID SNIIKLDKFF ADGINDSEIS 
LKVIDFILDI CRLSDKSIVI EGIEEKEQVD IIKTFLYEKI YIQGYYFSKP LDIKSLKAYT 
F