Gene CPF_1810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1810
Symbol
ID	4203281
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	2043346
End bp	2044845
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	26%
IMG OID	638082680
Product	phytoene dehydrogenase family protein
Protein accession	YP_696244
Protein GI	110801106
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1233] Phytoene dehydrogenase and related proteins
TIGRFAM ID	[TIGR02734] phytoene desaturase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.149228
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCCAA ATAAAAAAGC TATAATAGTT GGAGCTGGAA TAGGTGGATT AGCTACTGCT 
GTTCGCCTTC TTATTAATAA TTTTGAAGTA GATATTTTTG AAAAAAACTC TAAGATAGGT 
GGAAAAGTAA ATTTAATTGA ATACAAAGAT TTTAAGATAG ATTCTTCTGC TTCAATATTT 
ATGCTCCCTA AACCCTATTT AGAAGTATTT AAATATGCAA AAAAAGACCC TAAAGACTAT 
ATAGAGCTTG TAGAATTAAA TACTTTATAT AAAGTGTTTA ATGATGAAGG AGATAGTTTT 
AATATTTATT CAGACTTTCT AAAAACTACA GAGTCCTTAG AAAAGGTATT TAATGATGAA 
AGTTCAAATT ATTATAAATA TATATCTGAC TCATATAGAA GATATCTTTT AGTAGAAAAA 
TACTTTTTAA ACAGAAGTTT TTTCACCTTA AATTATTGGA GATATTTTAA ATCTTTACCT 
GAACTAATTA AAATACATCC TTTTAAAAAT TGTTATAAAA CCATTGAAGA ATATATAAGT 
AATGAATATT TAAAAAACTT ATTAGCTTTT CAATGCATGT ATATTGGGGA GTCTCCCCTT 
AAAAGTTCTA ATGTTTTTAA TTTAATTCCA TCAACCACTC AAATATATGG ATTATATTAT 
ATTAAAGGTG GAATGTACTC TTATGTGAAG GCTTTAGAAA AATTAATCCT AGAACTTGGT 
GGTAAAATAC ATCTTAACTC AAATGTAACT AATATACTTA TGGAAAAGAA TGTAGCAATT 
GGAGCAAAAA TAAACCACGA AAATATATTT TCTGATTTAA TTGTTTGTAA TTCAGATTTT 
ACTTATACCA TACAAAATTT ACTTCCTAGA AGTACATTTA AAAATAAAAT TTCTAGGCGA 
AAACAAAATA ATTTATCCTT TTCTTGCTCT ACATTTATAC TACATTTATT TCTTAAGAAA 
AAATATAAAA ATTTAGATGT ACATAATATA GTACTTAATT TAAATAAGAA AGAAGTTTTA 
TTAGCTCCCT TTATAGATGG GCCCTTGCCA AAGGAATATA TATATTATAT CTATTGCCCA 
AGCTCAATAG ATACTTCATT AACTCCTGAG GATTGTGAAT GCATTAATAT AACAGTACGT 
GTTCCAAACT TAAAAAAATA TAAATCAAAA TGGACTGAAT CTACAATTGT TTCTTTGAGA 
AACAAAATCT TGTATGACCT AAGTAAAATT AAAGGTTTAG AAGATATAAA AGAAAATATA 
ATTTACGAAA GCTATACAAC GCCTATGACC TTAAAAAATG ATTTTAATTG CTTTTTTGGT 
GCAGCTTTTG GTCTTAATCA TAATTTGCTA CAAACAACTA TTTTTAGACC TCAGGCAAAA 
ATAAAAAAAC TAAAGAATAT ATATTTTGTA GGTGATTCAG TACATCCTGG CTCTGGAATA 
TCAATGTCCT TAATCTCAGC TAAGCTATGC TGTGAAAAAA TAATATCAGA TTTTAGCTAA

Protein sequence

MSPNKKAIIV GAGIGGLATA VRLLINNFEV DIFEKNSKIG GKVNLIEYKD FKIDSSASIF 
MLPKPYLEVF KYAKKDPKDY IELVELNTLY KVFNDEGDSF NIYSDFLKTT ESLEKVFNDE 
SSNYYKYISD SYRRYLLVEK YFLNRSFFTL NYWRYFKSLP ELIKIHPFKN CYKTIEEYIS 
NEYLKNLLAF QCMYIGESPL KSSNVFNLIP STTQIYGLYY IKGGMYSYVK ALEKLILELG 
GKIHLNSNVT NILMEKNVAI GAKINHENIF SDLIVCNSDF TYTIQNLLPR STFKNKISRR 
KQNNLSFSCS TFILHLFLKK KYKNLDVHNI VLNLNKKEVL LAPFIDGPLP KEYIYYIYCP 
SSIDTSLTPE DCECINITVR VPNLKKYKSK WTESTIVSLR NKILYDLSKI KGLEDIKENI 
IYESYTTPMT LKNDFNCFFG AAFGLNHNLL QTTIFRPQAK IKKLKNIYFV GDSVHPGSGI 
SMSLISAKLC CEKIISDFS