Gene CPF_1057 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1057
Symbol
ID	4203689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1205257
End bp	1206513
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	30%
IMG OID	638081938
Product	sensor histidine kinase
Protein accession	YP_695503
Protein GI	110799811
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.197208
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAAA AGAATAAACC TAAAAATGTT ACCTCTATTG CAATAAAGAT TAATGCTATT 
TCTGTTAGAG ATTTATTTTT TAGATTTTTA GCAATTGACA TATGTTTAAT AATTATTTTA 
ATTATTCTTT GGTGTATTCA AGCTGAAAAA GATTTCTATG GAGAATTAGT AAAAAATGCA 
CAAAGGTCAT TTAACTTTTT CCCTATAGAA AATTCAACCT ATACAGTTGT TTGGAGTAAT 
GGAAAGACCA TGGTTAAAGA AGCTGGTGCT TTTTTATATT ATGTTAGAAA AATAGTTATA 
ATTTTAGGAA TAGTAGAAGG AGTATTTTTA TTAGAAGAAA TAATATTTGG TACAGCTAAA 
ATTAGAAAGA CCTTAAAACC ACTTAATGAA ATAGCAGAAA CAGCAAGTAG GCTTAGTAAT 
ATGGACTTTG ATGAGGAAAA ATTTCAAAGT CTTGAAGATG CTATTTCCAA AATAAGTCCT 
GTAACATCTG ACGAAAGAAT ACATATAGGT GATAGCGAAC TTAAAGGATT AGAGGATGCA 
ATAAACAAGC TTTTAGACAG GATGAGGGAT TCTTATAGGC AACAAGCAAG GTTTGTATCA 
GATGCATCTC ATGAACTTAG AACTCCTATT TCTGTAATTC AAGGATATGC TAATATGCTA 
GATCGATGGG GGAAAAATGA TGAGAGCGTA TTAGAAGAGT CTATTATAGC AATAAAGAGT 
GAATCTGAAA ATATGAAAAA TCTAGTTGAG CAGCTATTAT TCTTAGCTAG AGGTATTAAT 
GGAAAGACTA AGCTTACAAT AAAGGAATTT TCTTTAAATA ATATGATAGA TGAAGTTTTT 
GAAGAGTCTA AGATGATAGA TAAGAATCAT GTATATAACT ACATTGAATC AGAACATATA 
ACTGTTCAGG GTGATATGGC TTTGCTTAAA CAAACAGCTA GAATACTAGT TGAAAATGCA 
ACTAAATATA CAGAAGAGGG AGAAATAATA ACGCTTAAAG TAGGTGAGAA TTCTAAAGGA 
GAAGCTTATT TTTCAATTCA AGACAATGGA ATTGGCATGG ATGAGAATGA TGTGCCTCAT 
ATATTTGAAC GTTTTTTTAG GGCTGATACA GCAAGAGTTA GAAAAAATGG TGGAACAGGG 
CTTGGGCTTT CTATAGCAAA GTGGATAATT GATAACCACA AAGGGTACTT TAGTGTTTTA 
AGTAGAAAAG GAATAGGAAC AAGAATAACT GTTTACTTAC CACAAAATAT TAAGTAG

Protein sequence

MSKKNKPKNV TSIAIKINAI SVRDLFFRFL AIDICLIIIL IILWCIQAEK DFYGELVKNA 
QRSFNFFPIE NSTYTVVWSN GKTMVKEAGA FLYYVRKIVI ILGIVEGVFL LEEIIFGTAK 
IRKTLKPLNE IAETASRLSN MDFDEEKFQS LEDAISKISP VTSDERIHIG DSELKGLEDA 
INKLLDRMRD SYRQQARFVS DASHELRTPI SVIQGYANML DRWGKNDESV LEESIIAIKS 
ESENMKNLVE QLLFLARGIN GKTKLTIKEF SLNNMIDEVF EESKMIDKNH VYNYIESEHI 
TVQGDMALLK QTARILVENA TKYTEEGEII TLKVGENSKG EAYFSIQDNG IGMDENDVPH 
IFERFFRADT ARVRKNGGTG LGLSIAKWII DNHKGYFSVL SRKGIGTRIT VYLPQNIK