Gene Haur_1105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1105
Symbol
ID	5732996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	1265195
End bp	1266835
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	51%
IMG OID	641278243
Product	integral membrane sensor signal transduction histidine kinase
Protein accession	YP_001543881
Protein GI	159897634
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCAGCAGC ATCGTAAATT AACCCTCGTT CAACGCTTTG GGCAGCGCTT TGGCACGCTA 
CGCTGGAAAC TCACATGGTC GTATGTGTGG ATCAGCGTAG CGTTGACTTT GTTGATTAAT 
GGTTTGGCGT TTGGTTTAGT GATGGGTGCT GCTCCACCGC TCAATGCTCC CGCCTTGCTT 
AGCGCCGCCC AAAATCATGC CGCTGAGTTT AGCGAGGTTT TGCAAGAGCC AACCGATCAG 
CACACAATCC AACAGTTGTT ACGCTATCGC TTTGGTTCGT TGCGCGGCCA ATTTCTGCAA 
AATAACCTTG AATTAGCGAT TAGCAATACT ATCAATAATT CTCCCAGCGA TCTTTCGCAG 
GAAATGATTT TGATGCCAGC TGAGGTATTT TCGCCTGAAG CGACCAATGT GTTTAGCGAG 
AGCTACCACC TCTTATTGCT TGATGCGCAG GGTAATGTGC TCGGCGGGAC ATTTCCCAGC 
CGTACTCCGG CGGGCCAGCC CTGGAACGAT GCGATAGTGG GCAATGATCG ACGGGTTGTG 
CAGGCAGCAC TTGCTGGCAG CGACGATATC GATCAATTAA CTTGGAAGTA TGAGAATTAT 
TTAGTGATTG CCACTCCAGT TCGCGATCAA GCCAACCAAG TGATTGGGGC ACTGTATGTA 
CGTTCGCGGC CACTTAGCCA AAATCAAGTG ATTGTTGCAT TGTTGATGTT TGTTATTTTT 
ATTGCCAGTT CAATTGTTTC GATTATTGCC AATGCCTTAA TTGGCATGGT CTATGGCTGG 
TTTGTGGCCC GTAATTTTGT GCGCCGTTTG GTGCATCTCA CCCAAGCTAC CGATAGTTTG 
GCCGCTGGCG ATTTGAGCGT GCGGGTCAAC GATGGATCAA TCGACGAAAT TGGGCATTTG 
GCGCGGCGCT TCGACAGCAT GGCCCAACAG CTTGAATCAA ATGTCAAAAT GTTACGTCAA 
CTAGCTGATC GCAATGCTGC CTTAGTTGAG CAGGCAGGCC AATTGGCAAT CGTCGAGGAG 
CGTAATCGGT TGGCTCGCGA TTTGCACGAT AGCGTTAGCC AAGAGTTATT TAGCGTCACG 
ATGTTGGCGG CGGCTGCGCG TAATTTATTG CCAGCCCAGC CCGATAAAGC GCGTAGCCAA 
GTTGAACAAC TCAGCCAAAT GGCCCAACGC GCCTTGCACG AAACTCGTGG CTTGATCTTC 
GCACTTCGGC CTGCTGCGCT CGGTGATCAA GGTTTAGTCC CAGCATTACG TCAACTTACC 
GAAGAGGCAG CGCGTCGCCA AGGCTTGCAG ATTGAACTGA ATACCAACGG CGAACGGCGC 
ATTCCCTTAG ATCATGAGCA GGCACTCTAT CGGATTTGCC AAGAAGCCTT GGCCAATGTG 
ACCAAGCATA GCGGCGTGAA CAGCGCCAGC GTAAGCCTTG AATATGAAGC CCATCGCACC 
ACTTTAGAGG TGCGCGATCG TGGCCGTGGC TTTGATCAAG ATAAACCGCG CAATTCGCAC 
TCGCTAGGCT TGATTAGCAT TCAAGAACGC GCCAAAGCAG TTGGCGGCAC AGTTGAATTA 
ACTGCTGCGC CAGGCCAAGG CACAAGCCTA CGCATCGTTG TACCACGAAC CCAAACTGGG 
CTACTGGTCG AGCCACGTTG A

Protein sequence

MQQHRKLTLV QRFGQRFGTL RWKLTWSYVW ISVALTLLIN GLAFGLVMGA APPLNAPALL 
SAAQNHAAEF SEVLQEPTDQ HTIQQLLRYR FGSLRGQFLQ NNLELAISNT INNSPSDLSQ 
EMILMPAEVF SPEATNVFSE SYHLLLLDAQ GNVLGGTFPS RTPAGQPWND AIVGNDRRVV 
QAALAGSDDI DQLTWKYENY LVIATPVRDQ ANQVIGALYV RSRPLSQNQV IVALLMFVIF 
IASSIVSIIA NALIGMVYGW FVARNFVRRL VHLTQATDSL AAGDLSVRVN DGSIDEIGHL 
ARRFDSMAQQ LESNVKMLRQ LADRNAALVE QAGQLAIVEE RNRLARDLHD SVSQELFSVT 
MLAAAARNLL PAQPDKARSQ VEQLSQMAQR ALHETRGLIF ALRPAALGDQ GLVPALRQLT 
EEAARRQGLQ IELNTNGERR IPLDHEQALY RICQEALANV TKHSGVNSAS VSLEYEAHRT 
TLEVRDRGRG FDQDKPRNSH SLGLISIQER AKAVGGTVEL TAAPGQGTSL RIVVPRTQTG 
LLVEPR