Gene CPF_1220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1220
Symbol
ID	4202635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	1384213
End bp	1385850
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	22%
IMG OID	638082101
Product	GGDEF domain-containing protein
Protein accession	YP_695666
Protein GI	110799538
COG category	[T] Signal transduction mechanisms
COG ID	[COG3706] Response regulator containing a CheY-like receiver domain and a GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.12727
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATA GAAAAAAGAA ATATTTTTTA ATTTTATTAA TTTTTTTAAT AGTTATTAAT 
TTATTTATAT TTTCTTTTTA TAAATTTAAA GTAAATAAAA AAAATGAAAA ATATATAAAA 
AAAACTAATG TAATTTTATA TGAATCTAAA TTAGAGATGA AAAAAAGAAA TTTTAAAGAT 
TCTGAAAATA AACTTTATTC AATTATAGAT AATAAAGATA TGTTTTATAG TTTACCTGAT 
AATTTAAAGT TCGAAATTTA TAATTATTTA GCTATAATAA ATCTTCAACA AGAAAAATTT 
TTAAATGCTT TATCTTATTA TGAAGAAGCC TTTAAATATG CTGATAAAGA GTCAAAGATA 
ATTATTAAAC TAAACATGAC ATCTGCTTAT AGATATATGG GGGCCTATGT TACTGCTACT 
AATATTTTAG ATAAAATGCT AGATTCATCA TTATTATTTA GGAATGAAGA TTCTTACCTT 
AAAGAATATA CTTTATTAAA CTTAGCTGAA ACTTATTTTG CTGTAAATGA TATGACTGAT 
TTTAACTCTA CAATAGCAAA GGCATCTAAC TCTTATTATT ATGGCCCTGA AAATGATTTA 
GAAGACTTAA AAATCCTTTT AGATTCCTAT TTAATAATAA AAGCAATATC AGAAAATAAT 
CTTGATTTAG TACCAAACTA TATTTCTGAA ATAGAAGAAT TAGAGATTAA AAATAAAGAT 
GTTATATATT CTGAATTAGA AATGATTAAA ACTCGTTCTT ATGGTATGTA CTATAAAAGT 
ATTGGAGATT TTGATCTAGC ATTAGACTAC TTTTCAAAAC TAGAAAAATT AGCTGATAAT 
GAAGGTGCTT CTTATGTTTC ACTTTTTTCT ATCAGCGAAA GAATATCAAT TTATAGAAAA 
CTAAATGATA ATAAGCAGGT AGATTCTTTA ATAAATAAAT ATTATGAAAA ACAAACTTCA 
ATAAATGATA TAAATAACTA TGAATTTAAA TATTATATAG ATAATAAAAT TATAAACAAT 
CACGAATTAC CATTTTTAAA AGAGACCATT ATTATTTTGA TAATTCTATT TTTAACCTCT 
ATTCTATTAG TGCTTTTTTA CTTAAAAAAA GCTAGGGATT CAAAATTAGA TTCTTTAAAA 
GATGGGCTTT GCAATATTTA TAACAGGCGT TTTTTAGACT CTTACATAAA TAATTTAAAA 
GAAAAAGATT TGCCTATTTC TTTTCTAATG ATAGATGTAG ATTATTTTAA ACTTTATAAT 
GATAATTATG GTCATCAAGC TGGTGATTTT ATACTAAAAA GTATAGCCTC TGTACTTGAA 
AAAAACTCTC GTAAAGAAGA TATAGTTGCA CGTTATGGAG GGGAAGAATT TTGTGTTTTA 
CTAAAAGGTG CTTCTAAGTA TTCTTCTATT AACTACGCTA AAAGAATCAA AGAAAATTTA 
GATAATTTAA ATATAAAACA TAAATATTCA AAGACTTCAG ACCATGTAAC CTTTAGTATT 
GGAATATATA CTACATATAC TAAAAATGAT CTGAAAAATG CAATTAAATT TTCTGATAAA 
GCACTATATA TATCTAAAAC AAGAGGAAGA AATACCTATA CTTATCTAGA AGATAACTCT 
TCTGATTCTT CTAATTAA

Protein sequence

MKNRKKKYFL ILLIFLIVIN LFIFSFYKFK VNKKNEKYIK KTNVILYESK LEMKKRNFKD 
SENKLYSIID NKDMFYSLPD NLKFEIYNYL AIINLQQEKF LNALSYYEEA FKYADKESKI 
IIKLNMTSAY RYMGAYVTAT NILDKMLDSS LLFRNEDSYL KEYTLLNLAE TYFAVNDMTD 
FNSTIAKASN SYYYGPENDL EDLKILLDSY LIIKAISENN LDLVPNYISE IEELEIKNKD 
VIYSELEMIK TRSYGMYYKS IGDFDLALDY FSKLEKLADN EGASYVSLFS ISERISIYRK 
LNDNKQVDSL INKYYEKQTS INDINNYEFK YYIDNKIINN HELPFLKETI IILIILFLTS 
ILLVLFYLKK ARDSKLDSLK DGLCNIYNRR FLDSYINNLK EKDLPISFLM IDVDYFKLYN 
DNYGHQAGDF ILKSIASVLE KNSRKEDIVA RYGGEEFCVL LKGASKYSSI NYAKRIKENL 
DNLNIKHKYS KTSDHVTFSI GIYTTYTKND LKNAIKFSDK ALYISKTRGR NTYTYLEDNS 
SDSSN