Gene Haur_3446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3446
Symbol
ID	5735307
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	4333613
End bp	4335988
Gene Length	2376 bp
Protein Length	791 aa
Translation table	11
GC content	51%
IMG OID	641280593
Product	integral membrane sensor hybrid histidine kinase
Protein accession	YP_001546210
Protein GI	159899963
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.285515
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGCG GGTCGGTACG CCGTACAATG ATCACAATTG CAGCGATCAT TTTGAGCTTA 
ATGACCGGAT TAAATATCAT CGGGGTTGTT GAGCGTAGCA TGCTCAATAA TGATATTGAA 
TATGTGATCG ATTTAGAAGA TGCCGAACGT TTAGCTCGCG AAATTAGCCT CTACACTCAA 
TATCAAGCCC ATGCGCTCGA TGCCTATGCC TTAGGTGAAA TCGAGGAGCG TGAACACTAT 
ACCCGTTATC GCCAAGCCTT CGATGACAAA CGCCTAGAGC TTGAACAATT CTTCAAGAAC 
ATGCAGCCGA ACCCAGAAAC CAAAACAGCC TTTGAGAATG TACAAAAACT TAGCGCCGAC 
TATGAAGATG CCGGAGTTGC CTACCTCGCC CAAATCGACC TACGCATCCA AGAATCAGCG 
CCAACCCGCT CAACCGCAGA ACTGGCTGCT TGGAAAATCC TCGACGAACA GGCCGATCAA 
CTCGACGAGG CCACCCAAGT GCTCTCTGAT ATCATTGATG ATCAATCTGA AGCACTTGAA 
GCAACAATTA CCAAGCAAAA TGGCCGCATG ATTGTGGCAC TGACTGGGCG CAGTTTGGCG 
ATACTAGTAT TGCTAAGTCT GTTCGTCTAC TATCTGCTGG GGAGGGTCGG CAATCAATTC 
AAGTTGGTAC GCGACGGAGC GCAACGCTTT GCCGATGGCG ATTTTACCAC TGATATTCCA 
ATTCGCCGCT ATGATGAAGT AGGCCGCCTC GCTGCGATGT TCAATACCAT GGCCCAAACG 
ATTCGTGGCC AAATCGAGCG ACTTGAGCAA GCCAAAGATC ATGCCCAACG CTTGCAATTT 
GTGGCCGAAG AAGCCAATCG CGCCAAAAGT AATTTCTTGG CCAATATGAG CCACGAATTG 
CGCACCCCAC TCAATGCGAT CATCGGCTAT AGCGAAATTC TCCAAGAAGA ATGTGAAGAC 
CTCGGCCAAA CCGCAATGAT CGAAGATCTC GATCGGATTC GCCTCTCAGG GCGGCATCTG 
CTGACCTTGA TCAACGATAT TTTGGATTTG GCCAAGATTG AATCGGGCAA GGTTGAAATT 
TTGCCTGAGG AAATTTCGCT GCCCCAACTG CTGCACGATG TGCGCTCAAC CGTCGATCCG 
ATGATCATCA AAAATGAAAA TCGCTTGGTG ATCGAATCAG CAGCTGGCTT GCTGACGATG 
ATTAGCGACG AGACCCGTTT ACGCCAGATT TTGGTCAATT TGCTGAGCAA CGCAGCGAAA 
TTCACCGAAC ATGGCCGCAT TACCTTGCGC GTCCAACCAA GCGAAGAAGA GGGCTGGATT 
GATTTCAGCG TGCATGATAA TGGCATTGGC ATGAGCAACG CCCAATTATC ACGCTTGTTT 
CAGCCATTTA CCCAAGCCGA TGCCTCGACC ACCCGCAAAT ATGGCGGCAC TGGGCTGGGT 
TTGGCCTTAA GTCGGCGCTT GGCTCAATTG CTCGGCGGCG ATATTCGGGT ACAAAGTGAA 
TTAGGCGTTG GCTCAACCTT CAGCGTGCAC CTACCGCAAT CAGTCATCGA TATGGCTCCA 
GTTTCGTTAC TTGATGAAGC GCCAGTTATT ATCAGCGATG CCAACAACAA CCAACCCAAA 
GTGCTGATTA TCGACGATGA TCGCAATGTC CATCATCTGC TTTCGCGCAC GCTCAAGCGC 
GAGGGCTGGA GCGTCCTTAG CGCATTTGAT GGCGAAAATG GCTTAGCAAT GGTGCGCAAT 
CATCATCCAA CGGCAATTTT GCTCGATGTG TTGTTGCCAG GCCATGTCAA TGGTTGGGAG 
ATTTTGGCCG AAATCAAGGC CGACCCCAAA ATTGCCACAA TTCCGGTAAT TATGCATACG 
ATTGTGGCCG AGCCAAACCA AGGGGTTTCG TTTGGGGTGT ACGATTATTT GATTAAGCCC 
GTTGATCGCG GCCAATTGCT GCGCACGCTA CGGAGTTGTA TCGACCCGCA AAATGCCAAA 
ACCCAATTGG TTTTGGTGGT CGATGACGAT CATGATAGTC GGGCGATGCT GCGACGCATG 
CTCGAAGGCG CTGGCTGGAA AGTCTATGAG GCTGCCAACG GGCGCGAAGC CTTGGGCGCA 
TTGCATAGCC GCCCATTTGG CGCGATGATT CTCGATCTAA TGATGCCCGA AATGGATGGC 
TTCGAAACGA TCGCTGCCTT ACAAGAGCTT GAGCAATTCC GCGATTTGCC GATTATTGTG 
GTTTCGGCCA AAGAACTCAC TGAAGAAGAG CGGCAACAGC TTGAAGAGAC CGTTGAACGG 
GTGGTCAGTA AGGGGAATGT GCGGCGTGAA GAGATTTTGG CGTTGGTGCG CGAGCAAGTT 
CGGCGGCGCG TTGAGCAACC GCCTACAACC ACGTAA

Protein sequence

MKRGSVRRTM ITIAAIILSL MTGLNIIGVV ERSMLNNDIE YVIDLEDAER LAREISLYTQ 
YQAHALDAYA LGEIEEREHY TRYRQAFDDK RLELEQFFKN MQPNPETKTA FENVQKLSAD 
YEDAGVAYLA QIDLRIQESA PTRSTAELAA WKILDEQADQ LDEATQVLSD IIDDQSEALE 
ATITKQNGRM IVALTGRSLA ILVLLSLFVY YLLGRVGNQF KLVRDGAQRF ADGDFTTDIP 
IRRYDEVGRL AAMFNTMAQT IRGQIERLEQ AKDHAQRLQF VAEEANRAKS NFLANMSHEL 
RTPLNAIIGY SEILQEECED LGQTAMIEDL DRIRLSGRHL LTLINDILDL AKIESGKVEI 
LPEEISLPQL LHDVRSTVDP MIIKNENRLV IESAAGLLTM ISDETRLRQI LVNLLSNAAK 
FTEHGRITLR VQPSEEEGWI DFSVHDNGIG MSNAQLSRLF QPFTQADAST TRKYGGTGLG 
LALSRRLAQL LGGDIRVQSE LGVGSTFSVH LPQSVIDMAP VSLLDEAPVI ISDANNNQPK 
VLIIDDDRNV HHLLSRTLKR EGWSVLSAFD GENGLAMVRN HHPTAILLDV LLPGHVNGWE 
ILAEIKADPK IATIPVIMHT IVAEPNQGVS FGVYDYLIKP VDRGQLLRTL RSCIDPQNAK 
TQLVLVVDDD HDSRAMLRRM LEGAGWKVYE AANGREALGA LHSRPFGAMI LDLMMPEMDG 
FETIAALQEL EQFRDLPIIV VSAKELTEEE RQQLEETVER VVSKGNVRRE EILALVREQV 
RRRVEQPPTT T