Gene CPF_0198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0198
Symbol
ID	4203663
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	240450
End bp	242825
Gene Length	2376 bp
Protein Length	791 aa
Translation table	11
GC content	24%
IMG OID	638081082
Product	sensory box histidine kinase
Protein accession	YP_694661
Protein GI	110799765
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00155091
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAACC CAATATTTTT TCATATTTTT AATGATGATA AAAATAAATT AGAAACTCAA 
AGAATAATAA AACTATCCAT TTTTATAGTT TTCTCTATAT TTTTTATATT GCTAATAGAT 
TTATCCTATA AAGTGCTTAT TAGAAAAAAT ATAGAGTTTA TTCCTGGTAA TTCTATGCCA 
AGTTTCTCAT TAAGTTTATC ATTAATATTA GGAACAATGG CATACATAAG TTCATTAATA 
TACTATTCAA GCACCAAAAA AGATGATTTT TTTATAATCT CTTTAATATA TATGAATTTA 
TCTGTAGAAC TTTTAATTAC TAAAGGACAT AACCTAATAA TATTCGATAA GTTTATTTTT 
ATACACGCAA TATTTAGGAT AATTTTGCTT TTTTATGTTG CCTTTAATAA GAAAGGAATA 
TCCCCTCTTA TTACTAAACA TAAAATAATT ACATCAATAG TAGTTTTTTT ATTTTCAGTT 
ATAACACCTA TGATTAACTA TAGAATTTTT TCTAACAATT TATTTGCTAA AGATATTTAT 
TTTTATGCTA CTTTAATGAC TATGATTATT ATCCTATACA TAATCGCTTG CATATTCTTA 
TCAAAGAAAT CTTTAGATGA TTGTGAGTTA ATATATTCAT TTATAATTGC TAGTATTCTT 
TTAATAGCCC TTAGAGGATT ATATTGGATT TGTGAAGTAC TTCTTCCAAA TATAACACTT 
TTAAAAACCA ATAATGTTGT TCTTCTACTT ACCATACTAT CATTTTTATT GGCTATAAGT 
GGAGTTTTTA ATGAAATTAC AGCTAAAAAC AAAAGAAGCT CTTTACTACA AAATGAACTT 
CAAGTTTTTT ATCACTTAGT TGAATTTAAT ACTAGTAGTT CTATAATTTT ATATGATAAT 
AAAAAGAAGG TTATATATAC AAACAAGACA ATAAGAGAAC GCTACTGCAA ATCAACTAAA 
TTAAAAGATC AACTTAAAGA GGTAGAAAAA TTATTTGTAG ATTCGATTTT TATAGATGAC 
TCTGAAAAAA ATGCTACTAA AGCACTTTTT AATAAGGGCA ACTGGGAAGG TAAGCTTATT 
TTAAAAAATG GCAAAATAGT AAGTGCCTAC ATACAGATAT TAAATGTTGA AAATAAAAAT 
TATTTTGCTG TAAATTTAAA AGATATAACC GAAGAATATA CCCTAACAAA AAATATTAAA 
AGAAATGAAC AATTATTAAG TTGTATAAAT AATAACGTAC AGGATTTAAT AATAAGTGTT 
GATAATAATG GTTTAATTAC ATATGTTAAT GATTCTGTAT TAAAAACATT AAATTATACC 
TATGAAGAAA TTATAGGAAT GCCTATAATA AACCTTTTAG GTAAAAATGA TGAGATATTA 
AATCAATTAA AACTAGAAGA TGAGGAAGAT AGTATTAAAT GTAAACTTGT TGGTAAACAT 
TCCTTTGTAT ATGTAGAATC TATAATTAGA ACTTTAAATG ATAATAATGA AATTCCTTAT 
GGAAAAGTTA TAGTTGCAAA AAACTTAACC TCTAAAAAAC GTCTTGAAAA TTTAGCTATA 
AAATTTAAAG AAGCTAAGGC TTATGAACAA ATAAGAAATG AATTTTTCGC CAATATATCA 
CATGAGCTTA GAACACCACT TAATATTATC TATTCTACAA TACAGTTATT AAATTCTAAG 
CATGAAACTG ACCCTATGGA CTTTAATAAC TTCTATGATA AATATAAGCA AGGTCTTAAG 
ATAAATTGTT ATAGAATGCT TAGACTTATA AATAACCTTA TTGATGTTAG TAAAATTGAA 
GTTGGATTTT TAAAAGCTGA TTTTACTAAT AGAGATATAG TATTCCTTGT AGAAAATATA 
GTATCTTTGG TTATTCCTCA TTCTGAAAAT AAGGATATTA ATATAATCTT TGATACTAAT 
GTTGAAGAAA ACATAATAAA ATGTGATCCT GTAAAAATTG AAAGATTAAT TCTTAACTTA 
CTTTCAAACG CAATAAAATT CACCCAAAAT CATGGTGAAA TATTTGTAGA TTTAAACATC 
TCAAAGGATT GGGTTAAAAT AAGCATAAAA GATAATGGAA TTGGTATTCC CAAAGAAATG 
CAAGCATCAA TTTTTGATAG ATTTGTACAA GCTGATAAAT CCTTAAAAAG AAGAAATGAA 
GGTAGTGGAA TAGGTCTTAG CATTGTAAAG TCTATTGCAG AACTGCATGA TGGTAAAATT 
GAACTTATAA GTGATGGAAT AAAAGGTTCA GAATTTATAG TATGGCTACC AAATGTAAAA 
TTAAATTACA CAGAAGAAAG CAATAATTTA GTTGATTATA TAACAGATGA TAAAAATATA 
GAGTTAGAGC TTTCTGATAT TTATGAAGTA CATTAA

Protein sequence

MDNPIFFHIF NDDKNKLETQ RIIKLSIFIV FSIFFILLID LSYKVLIRKN IEFIPGNSMP 
SFSLSLSLIL GTMAYISSLI YYSSTKKDDF FIISLIYMNL SVELLITKGH NLIIFDKFIF 
IHAIFRIILL FYVAFNKKGI SPLITKHKII TSIVVFLFSV ITPMINYRIF SNNLFAKDIY 
FYATLMTMII ILYIIACIFL SKKSLDDCEL IYSFIIASIL LIALRGLYWI CEVLLPNITL 
LKTNNVVLLL TILSFLLAIS GVFNEITAKN KRSSLLQNEL QVFYHLVEFN TSSSIILYDN 
KKKVIYTNKT IRERYCKSTK LKDQLKEVEK LFVDSIFIDD SEKNATKALF NKGNWEGKLI 
LKNGKIVSAY IQILNVENKN YFAVNLKDIT EEYTLTKNIK RNEQLLSCIN NNVQDLIISV 
DNNGLITYVN DSVLKTLNYT YEEIIGMPII NLLGKNDEIL NQLKLEDEED SIKCKLVGKH 
SFVYVESIIR TLNDNNEIPY GKVIVAKNLT SKKRLENLAI KFKEAKAYEQ IRNEFFANIS 
HELRTPLNII YSTIQLLNSK HETDPMDFNN FYDKYKQGLK INCYRMLRLI NNLIDVSKIE 
VGFLKADFTN RDIVFLVENI VSLVIPHSEN KDINIIFDTN VEENIIKCDP VKIERLILNL 
LSNAIKFTQN HGEIFVDLNI SKDWVKISIK DNGIGIPKEM QASIFDRFVQ ADKSLKRRNE 
GSGIGLSIVK SIAELHDGKI ELISDGIKGS EFIVWLPNVK LNYTEESNNL VDYITDDKNI 
ELELSDIYEV H