Gene Cphy_3033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3033
Symbol
ID	5743359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	3705830
End bp	3707731
Gene Length	1902 bp
Protein Length	633 aa
Translation table	11
GC content	36%
IMG OID	641294134
Product	histidine kinase internal region
Protein accession	YP_001560129
Protein GI	160881161
COG category	[T] Signal transduction mechanisms
COG ID	[COG2972] Predicted signal transduction protein with a C-terminal ATPase domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0284117
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTAAAGA TTCTGAAAAT TAATAAAATG AAAAAGCAAA ATAAGAGAAA ATATTTGGGC 
CTAAAAGGCA GGATGCTGCT CGGTATTTTA CAGGTGCTGA TTCCGATTAT GATAGTGATC 
ACTATATTAT TCTGGAATAC ACGAAAAGTT ATGAAGCAGG AATATATGCG AACTACCCAA 
AGCAGGGTTA CTGAGATTGC TAATAAAATA GATGCTAAAC TTACGGATAT TTACAGTGTT 
TCTGATAATT TCGCTGCAAA TGACCAGTTG GATAAATATA TTGAAAAGGT ATATTCACCG 
CAAGAGCAGA TTTATAAGAA ACTGGATATT GTTCGTATTT ACAGTAATAT ATTTTCAGCT 
TATGATATAT TAAATAAGAG GGAAAGAATC AGTGCAATAT ACACATACAA AGGGGAGTTG 
TTTAATTTTC TGGACCCTAA TAAGAATACG AAAGAGGTTA TAGAAAAATT ACAGGATATG 
AATATTGAAG ATCCTGACCT TTTGATGAAG TTTCGCTGGT TTCCAGTGCA AGATAATTTT 
CTTTTGAGTG ACTATCCGGA GGGGATACGC GAGCAGAAGG CTGTTATGGG TATTCGAAGG 
ATTTATTCAT GGGAAAAAGG AAAATATCAA TATGTACAGT TATTTGCCTT GAAAGAAAAA 
GAGATATATG AACAGTATGT TCAACTTGCT GAATCTATTC CTGGTGATAT CTATATTTTA 
ACAGGAGATG GCAGTTTGAT TTCCTCGAGC AATGAAGAAG TGGTAAAAGC CGGGGAAATA 
TCAAGTAAAT TAAAAGATAT GATCTTAGAG CGTACCAAGG ACTCTCAGGA AATGCAAGAT 
TCTTCGGGAC ATAAATTGGT AAATGTAAAA GTTTCCGAAG TAAATGACTG GATGACAGTT 
ATGATAATTC CTGTAAATGC GGTTACTAGG GATATGGATA TGCTATACCT TAGAATATTC 
TTGGTTATGA TGGTTTGTGT CGGACTTTGT GCTATCATGG TATTATATTT ATATAAGAGC 
TTTATGGATC CAATCGGCGA GCTCAATGCC TCAATGAAAG AAGTGTATGG TGGTAATCTA 
AACGCTTATA TTGAAGTGAA ACAGAAAAAT GAAATGGGTG ATATGATACG CTATTACAAT 
TCAATGCTGG AGCAAATTAA TACCCTTTTC ATTGAAGATT TAAAAGCAGA ACGTAAGAAA 
AAAGAACTGG AACTTGAAGT ATTGATGAGT CAGATTAACC CTCATTTCCT TTATAATACT 
CTGGAGAATA TTGTGTGGAT ATCCAATGAT GCTGGCAGAC CAGACATTGG ACGTATGGCT 
GCCTCCCTTG GCAGAATGTA TCGTTTGTCA ATAAGCGGGG GTCAGGTTAT TGTCTTAATG 
GAACACGAAA TAGAGCATCT GATGGCCTTT GTCAATATTC AAAAAAACCG CTATAAGGAA 
GAGTTTGAAT TTGACCTCCG TACGGATATG CAGCAGATAC ATGGATTGTA TTCTTTAAAG 
ATATTGCTAC AACCTGTGGT AGAAAATTCT TTCCTATATG GTATGACTGG ATTAAAACAT 
CCAATGCTAA TCAGGGTAAC TATTAAAGAG AAAGATGGAT GGGTCACCAT AAAAGTGATG 
GATAATGGCC GTGGAATGGA CAAAGAGCAA TTAAAGGAAA TACGAAACCA AATTCGCTTT 
GGAAGGACAG AGAAGGCAGA ACAAGAGAGA AACCGCCGTA GTACCGGTAT CGGGCTCCAT 
AGTGTGGAAA TGAGAATTAA GCTGTACTTT GGAGTTGATC ATGCTGTTTC TATATATAGT 
AAAAAAGAGG TGGGAACTTT AACTGTCATT CGGATCCCAA AGATAACGAA AGATGATGTT 
GACGAACGTG GAAATTTGAT AGAAAATAAG CGAATAAAGT AA

Protein sequence

MLKILKINKM KKQNKRKYLG LKGRMLLGIL QVLIPIMIVI TILFWNTRKV MKQEYMRTTQ 
SRVTEIANKI DAKLTDIYSV SDNFAANDQL DKYIEKVYSP QEQIYKKLDI VRIYSNIFSA 
YDILNKRERI SAIYTYKGEL FNFLDPNKNT KEVIEKLQDM NIEDPDLLMK FRWFPVQDNF 
LLSDYPEGIR EQKAVMGIRR IYSWEKGKYQ YVQLFALKEK EIYEQYVQLA ESIPGDIYIL 
TGDGSLISSS NEEVVKAGEI SSKLKDMILE RTKDSQEMQD SSGHKLVNVK VSEVNDWMTV 
MIIPVNAVTR DMDMLYLRIF LVMMVCVGLC AIMVLYLYKS FMDPIGELNA SMKEVYGGNL 
NAYIEVKQKN EMGDMIRYYN SMLEQINTLF IEDLKAERKK KELELEVLMS QINPHFLYNT 
LENIVWISND AGRPDIGRMA ASLGRMYRLS ISGGQVIVLM EHEIEHLMAF VNIQKNRYKE 
EFEFDLRTDM QQIHGLYSLK ILLQPVVENS FLYGMTGLKH PMLIRVTIKE KDGWVTIKVM 
DNGRGMDKEQ LKEIRNQIRF GRTEKAEQER NRRSTGIGLH SVEMRIKLYF GVDHAVSIYS 
KKEVGTLTVI RIPKITKDDV DERGNLIENK RIK