Gene CPF_1407 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1407
Symbol
ID	4203294
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	1581901
End bp	1583889
Gene Length	1989 bp
Protein Length	662 aa
Translation table	11
GC content	33%
IMG OID	638082287
Product	hypothetical protein
Protein accession	YP_695852
Protein GI	110801217
COG category	[C] Energy production and conversion
COG ID	[COG1032] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00374356
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGAAA ATAAGTTTTT GCCAATTTGC AAAGATGATA TGATAGAAAG AGGATGGGAA 
CAATGTGACT TTGTACTAGT TACAGCAGAT GCATACATAG ACCATCATAG TTTTGGTACA 
GCAATTATAT CTAGGGTTTT AGAGAATGCT GGATATAAGG TTGGAATAAT AGCTCAACCA 
GATTGGAAGA GCGTTGATGA TTTTAAAAAA TTAGGTAGAC CAAGATTAGG ATTCTTAGTT 
AATGGTGGTA ACATGGATCC TATGGTTAAT CACTATACAG TAAGCAAAAA GTTAAGAAAG 
AAAGATCTAT ATACTCCTAA GGGGGAAATG GGTAAGAGAC CTGATAGAGC TACAATAGTT 
TATTGTAATA AAATAAGAGA AGCTTATAAG GATGTTAACA TAGTAATTGG TGGAATTGAA 
GCTAGTTTAA GAAGATTTGC TCATTATGAT TACTGGGATA ACAAAGTGAG AAAATCAATC 
TTAGTTGATA GTGGAGCGGA CCTTTTAGTA TATGGAATGA GTGAAAAGCA AATCGTTGAA 
GTGGCTGATT TCTTAAATCA AGGATTTGAT GGAAAGTACA TAAGACATAT ACCAGGAACA 
TGTTACATAG CCGATAGTTT AGATGAAATC TATGAGGAGC ATATAGTTCT GCCATCATTT 
AAAGAAGTTT CAAGTGATAA GAGAACTTAT GCAGAATGCT TTAAAATTCA ATATGATGAG 
CAAGATCCTG TAAGAGGAAG AACTTTAGTT CAAGAACATA ATGGAAAATA TGTTGTTATA 
AATAAACCAG AAATGCCTCT TTCAAGGGAA GAATTAGATA GAGTATATGC TCTTCCATAT 
CAAAAAACTT ACCATCCTAT TTATGAGAAA GATGGTGGTA TAGCTGCTAT TGAAGAGGTT 
AAGTTTAGTA TAGTAAGTTC AAGGGGATGC TCAGGAAACT GTTCATTCTG TGCAATAACC 
TTCCATCAAG GAAGAATTGT AACTAGTAGA AGTGAAGATT CTATAGTAGA AGAAGCTGAA 
GAAATAACTA AATATGATGA TTTTAAAGGA TATATACACG ATATAGGGGG ACCTACAGCT 
AACTTTAGAA AGCCAGCATG TAAGAAGCAA CTAACTTTAG GAGCTTGTAA ACATAAAAGA 
TGTATGTCAC CAGGTATATG CAAGAATATG GAGGTAGATC ATAGAGAATA CCTTCATTTA 
TTAAGAAGAG TAAGAAAATT ACCAGGAATT AAAAAGGTAT TTATACGTTC AGGACTAAGA 
TATGATTATA TAATGGCAGA TAAGGATGAT ACTTTCTTTA AGGAATTAGT TGAGCATCAT 
GTAAGTGGTC AATTAAAAGT TGCACCAGAG CATGTATCTC CAAATGTTTT AAAATACATG 
GGTAAACCAG CAGGAAAAAC TTATGATGAG TTTAGAAGAA AATTCTTTAG AATCACAGAA 
AGATTAGGAA AGAAACAATT CATCATTCCT TATTTAATGT CAAGTCATCC AGGATGCAAG 
TTAGAAGATG CAATTATGCT TGCTGAATAT TTAAGAGATA TAAATTATCA ACCAGAGCAG 
GTACAAGATT TCTATCCAAC ACCAGGAACA TTATCAACTA CAATGTTCTA TACTGGATTA 
GATCCTTTAA CAATGGAAGA AGTTTATATT CCTAGAAGTA AAGAAGAAAA AGCAATGCAA 
AGGGCTTTAT TACAATTTAA AAATCCAAAG AATTACAACA TAGTTTATGA TGCTTTAGTT 
AAGGTAGGTA GAGAGGATTT AATTGGTAAT GGTCCAAAAT GCTTAATTAG AGATAAAAAT 
AGCTTTGGAA AAGGAAATAA TCATAGTAAT CACAAAAGTG GTGGAAGAAA GAGTAGAAAT 
GAGAACAGCG GAAGAAGAGA GTCAGAAGAT AAGAAAAGAA GTTCTCATAG TAAAAAACAA 
AGAGGAAACA AATCAAGAGG ATTTGATCAA AAGAGCCAAA GAAGCTCAAA GGGCAAGAAA 
AGAAGATAA

Protein sequence

MSENKFLPIC KDDMIERGWE QCDFVLVTAD AYIDHHSFGT AIISRVLENA GYKVGIIAQP 
DWKSVDDFKK LGRPRLGFLV NGGNMDPMVN HYTVSKKLRK KDLYTPKGEM GKRPDRATIV 
YCNKIREAYK DVNIVIGGIE ASLRRFAHYD YWDNKVRKSI LVDSGADLLV YGMSEKQIVE 
VADFLNQGFD GKYIRHIPGT CYIADSLDEI YEEHIVLPSF KEVSSDKRTY AECFKIQYDE 
QDPVRGRTLV QEHNGKYVVI NKPEMPLSRE ELDRVYALPY QKTYHPIYEK DGGIAAIEEV 
KFSIVSSRGC SGNCSFCAIT FHQGRIVTSR SEDSIVEEAE EITKYDDFKG YIHDIGGPTA 
NFRKPACKKQ LTLGACKHKR CMSPGICKNM EVDHREYLHL LRRVRKLPGI KKVFIRSGLR 
YDYIMADKDD TFFKELVEHH VSGQLKVAPE HVSPNVLKYM GKPAGKTYDE FRRKFFRITE 
RLGKKQFIIP YLMSSHPGCK LEDAIMLAEY LRDINYQPEQ VQDFYPTPGT LSTTMFYTGL 
DPLTMEEVYI PRSKEEKAMQ RALLQFKNPK NYNIVYDALV KVGREDLIGN GPKCLIRDKN 
SFGKGNNHSN HKSGGRKSRN ENSGRRESED KKRSSHSKKQ RGNKSRGFDQ KSQRSSKGKK 
RR