Gene Haur_1161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1161
Symbol
ID	5733054
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	1333384
End bp	1334664
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	49%
IMG OID	641278301
Product	integral membrane sensor signal transduction histidine kinase
Protein accession	YP_001543937
Protein GI	159897690
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCAAAA CGATCATTAA TCGAGCCAAA AATCATGCCG ATCCTGCTAT TGTAGTTCAT 
TATCAACACC TGCTGGAGCA CAACAAACGC CGCTTGATCG AGTGGATTAT GCTGTTAGCT 
GGTGGTTTGG CTTTGCCATT TACGCTTGTA TTAATCGTAG CGGTGGCCAA TCATCAGCAG 
CCAAGTAGTG TTTTGGTTTT ACACCTTACC CGTAGCCTGC TCAATCCTTT ACTAGTTTGG 
TGGTTGCTAC AGCGTAAACA AATTAATTGG GCTTGGCATT CTACGATGGT GTTTGCAATG 
GCACATAATA CGGTTTTAGC CTATGTGATG CACTTGCCAA ATGTAATTAT TGTAGAGCTG 
TTTGCGTTGG CCGGTTTTGC GGTGGTGATG CCATTTTGGC AGGTGTTGGC GTACATTGGC 
GGGCTGATTG GGCTGAATTA TTGCTTTGCA GGGCAATTTA TTGTGCTCAA TGAATGGGCT 
TTGGTGATGA TTGTCGTGCT GAGTATTGTG TTGATGTGCA GTACGATTGG CTTTGTTTCG 
CGCCAAACCT TGTGGCATGC CAGCCAACAA CATAGCCAAA CCGCTGAGTT GGTGCAACAA 
CAGAGCAGCA TGCAACAGCA ACTTCACGAT TTACAAACCC ATGTGCAACA ACTGAGTTTG 
CTGAAACACG ATTTGCGCCA GCCCTTGAAA AGCGTTCAAG GCTTGTTGCA AGGCTTGGCT 
TTTGAACAAC CAAGCACGCA TAGCACGATT CAGCCAGCGC TAGCCGCAAC CCAACGAGTC 
GAACGTCAAC TTAATAATTT GCTCGATCAA GCCCGTCAGC AGCTTGGTCG CCAACGGGCA 
AGCCTCGAAA TCATCGATGT ACAGCACTGT TTGGGGCAAT TGCAGCCAGC AATCAGCGGT 
TTGGCGGCCT ACTACAGCGA GCCAATTGTC AAAGTGCAAC TTGAAATTGA CGCGGGCAGC 
GTGATTGTGG CCGATCGTGA GCAATTTGAG CGAGCCTTAT TCAACTTGCT CGATAATAGT 
TTGAGCCGTT GCCATCACGA GGTACGTATC AGTAGCTATC GATCGGAGCA AAACGTGATA 
ATCGAAGTTC GTGATGATGG GGCGGGCATG CATCAAGCCT TACGCACGGC GCTGAATCAG 
GCTGATTTTA GTGCGATTAA GCAAGGCTTG GGTTTGAAGC AAGTGCAACA GATGCTTACG 
CAGGCCCAAG CGTGGCTGCA TGTGCCCGAC GTTGCGATAG GCTGCACGCT TCAACTGCAT 
TTTCCACAGG CTACCCAATG A

Protein sequence

MLKTIINRAK NHADPAIVVH YQHLLEHNKR RLIEWIMLLA GGLALPFTLV LIVAVANHQQ 
PSSVLVLHLT RSLLNPLLVW WLLQRKQINW AWHSTMVFAM AHNTVLAYVM HLPNVIIVEL 
FALAGFAVVM PFWQVLAYIG GLIGLNYCFA GQFIVLNEWA LVMIVVLSIV LMCSTIGFVS 
RQTLWHASQQ HSQTAELVQQ QSSMQQQLHD LQTHVQQLSL LKHDLRQPLK SVQGLLQGLA 
FEQPSTHSTI QPALAATQRV ERQLNNLLDQ ARQQLGRQRA SLEIIDVQHC LGQLQPAISG 
LAAYYSEPIV KVQLEIDAGS VIVADREQFE RALFNLLDNS LSRCHHEVRI SSYRSEQNVI 
IEVRDDGAGM HQALRTALNQ ADFSAIKQGL GLKQVQQMLT QAQAWLHVPD VAIGCTLQLH 
FPQATQ