Gene Haur_4656 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4656
Symbol
ID	5736503
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	5947907
End bp	5949940
Gene Length	2034 bp
Protein Length	677 aa
Translation table	11
GC content	50%
IMG OID	641281820
Product	multi-sensor signal transduction histidine kinase
Protein accession	YP_001547415
Protein GI	159901168
COG category	[T] Signal transduction mechanisms
COG ID	[COG2203] FOG: GAF domain [COG2205] Osmosensitive K+ channel histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGACG TTGCAACTAC CCAAAATCAC GCACGTCCAA TCAGCGGTTT TCAGTTGTTG 
GCAATTGCCG AGGCAATCAA CAACGCAGCA AATCTTAGTT CTTTGGTAGC TACAGTGGCC 
GAGTTATGTG CTACTGGTTT TGGGGTCGAA GTCGTTAAGT TGGGGCTGCT TGATAACGAA 
CACCATAGCG GTTCGTCCAC GCCATATCTC TATGGCAACC CCAGCAAAGC CACCCAAAAA 
TTGCTCGATC AAGCGATTGC CCAAACCATC GAACAAAAAA CTGCCCTGTT GCCAAGCAAT 
GACGAGAGTG CCCAAGCCCA ATTGTTGGTG TTGCCGTTAT TGGCCAGCCA GCAATTAATT 
GGCTTTTTGG CCTTGCTCTT GCCCAAAAAA GGCCGTTGGT CGGCTGAAGC AATCGAGGCT 
GCTCAGTTGT TGGCGCATAA TTTGGCTCTA GCGATTTCAG CGGTTCAGCT TAAAGACTAT 
ACCGCTAAAC GTAATCAAGA AATTAATACG CTCAACGATA TCGCCGCCAC AATCACTTCA 
TCGCTTGATC CACGCCAAGT CTATCGCTTG GTGGTCAAGA AGATCAACGA ATATTTTCAG 
GTTGAGGCTG GTTCACTGCT ACTGCTCGAT CCCGTGACCA ACGAATTGGT CTTTGTGATG 
ACGCTTGAGG CGGGCGAAGA AAAATTGGCG GGCGTGCGGG TTCCACCTGG CCAAGGTTTG 
GTTGGGGCAG CAATTACCAC CCGCCAGCCA GTCGTCGTGC TCGATGCCCA AAACGACCCA 
CGTTTCTATC GGCGGGTTAG CGAGGATGTT GGATTTGTGA CGCGCTCGGT CTTGTGCGTG 
CCCATGCTGG TGAAAAATCG TGAAATTGGG GTGATTCAGT TGTTGAATAA GCTAGAAGGC 
GTATTTAACA CTGAAGATAC CCAACGCCTG CAAGCTATGG CTAACACGGT GGGCGTGGCG 
ATCGATAACG CTAATCTGTT TCACGAAGTT TCGCAAAACC GCAATCGCCT CCAAGCCTTG 
CTCAACTCCA CCACCGACGG TATTTTGATG ATCGACCCTG ATGATGTGGT GTTGACTGCT 
AATCCAATGC TGGGTGAGTT GTTTGGCTGG GAATGGCGCA ATATCATCGG CGAGGCTGGC 
AGCGATATTC TGGCTCGCAT CAAAGAGCAA TCGCGGGTGG TCAACGAGTT GCCCAATAGC 
GAAACCTGCG AAATTGAAGT GTTGCGGCCT CGTACCCGCT ATGTGCGCCA AGAGCCATTG 
CCAGTGCGCA ATAATTTTGG CAATGTGATT GGCACGCTGA TTGTGTTCCA CGATATTACC 
GAGGAATATC AGCTAGCCCA AATTCGCGAA GATTATATGG GCATGTTGGT GCACGATTTG 
CGTGCGCCAC TCACGGCGAT CATCAATGGT ATGACCATGG TGCGCCGTGG TTTTGCTGGC 
CCAATTAACG ACCAGCAACG CGAATTGCTA GATATTGCCA ACAATAGCAG CCAAGAAATG 
GTTGGCATGA TCAATACCTT GCTGGATATT AGCAAGATGG AAGCTGGCGA ATTGGTGCTG 
AATCGTGCGC CATGCTCAGC CTACGAAATT GTTGATCGTG CTTCGGAACG TTTGATTAAC 
TCAGCTCGCA GCGTTGATAT CAGCATCAAT CTGGATATGG CCCTGAATTT GCCAATTATC 
GATGCTGACC AAGATAAAAT TGTGCGGATC TTGCAAAACC TGCTGGATAA CGCGATCAAA 
TTTACGCCAG TTGGCGGAAG TGTTACAATC CGCGTGCGCC AATTAACTGA TAATGAAAAG 
CAGACGATCT GCTGGAGTGT AATTGATGCC GGACCGGGCA TTCCCGAAAG CTATCGTGCC 
AAGATTTTCG ATAAGTTTGT GCAGGTTGCT GGCCAGAGAA AAGGCACGGG CTTGGGCCTG 
GCCTTTGCCA AACTTGCATC AGAAGCCCAC GGCGGGCGGA TTTGGGTTGA AAGTGTTGAG 
GGCGAAGGTA GTACATTCTC GTTTACCATT CCGTATGAGC CAGCAGTGAA ATAG

Protein sequence

MADVATTQNH ARPISGFQLL AIAEAINNAA NLSSLVATVA ELCATGFGVE VVKLGLLDNE 
HHSGSSTPYL YGNPSKATQK LLDQAIAQTI EQKTALLPSN DESAQAQLLV LPLLASQQLI 
GFLALLLPKK GRWSAEAIEA AQLLAHNLAL AISAVQLKDY TAKRNQEINT LNDIAATITS 
SLDPRQVYRL VVKKINEYFQ VEAGSLLLLD PVTNELVFVM TLEAGEEKLA GVRVPPGQGL 
VGAAITTRQP VVVLDAQNDP RFYRRVSEDV GFVTRSVLCV PMLVKNREIG VIQLLNKLEG 
VFNTEDTQRL QAMANTVGVA IDNANLFHEV SQNRNRLQAL LNSTTDGILM IDPDDVVLTA 
NPMLGELFGW EWRNIIGEAG SDILARIKEQ SRVVNELPNS ETCEIEVLRP RTRYVRQEPL 
PVRNNFGNVI GTLIVFHDIT EEYQLAQIRE DYMGMLVHDL RAPLTAIING MTMVRRGFAG 
PINDQQRELL DIANNSSQEM VGMINTLLDI SKMEAGELVL NRAPCSAYEI VDRASERLIN 
SARSVDISIN LDMALNLPII DADQDKIVRI LQNLLDNAIK FTPVGGSVTI RVRQLTDNEK 
QTICWSVIDA GPGIPESYRA KIFDKFVQVA GQRKGTGLGL AFAKLASEAH GGRIWVESVE 
GEGSTFSFTI PYEPAVK