Gene Hoch_5638 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5638
Symbol
ID	8548052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	7740365
End bp	7741987
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	67%
IMG OID	646390306
Product	histidine kinase
Protein accession	YP_003270008
Protein GI	262198799
COG category	[T] Signal transduction mechanisms
COG ID	[COG4251] Bacteriophytochrome (light-regulated signal transduction histidine kinase)
TIGRFAM ID	[TIGR00229] PAS domain S-box [TIGR01145] ATP synthase, F1 delta subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAACA CCCACGAGGT CTTGGCGCTA GCGGACAAGG CACGTGCATC GGACGATATC 
GACGCCTACG TACGAGCGTC CGGCCACAGC TTGGCGGCCG TGGTCCACTC GCTCGACGAT 
GTGCGTGCGC GTCTGGGTTT GGAGGCGCTC AGCGGCGAGG ATCCCGCGGT CCTGATCGTC 
GAGGCGGGAG CCTGGGACGA GCGCGCTGGC TTCGCCGACG CGTTGGTGTC CTTGGCGCGT 
GAGGAGGGCG TCCCCGTGGT CTGGTTGCAG GACGACGGGC ACGAGGCCCC CGAGGCATTT 
GCCCACAGCG AGGTGGTCGT CGCGAGCTCG GCGCCGCGCG AGCTGGGGCT GGCGGTATCG 
CTGGCCATGG CGCAGTGGAG CGCCGGCCGC GCGCAGCGCA CCAGCCGCGA GCTGGGCGAG 
GCTCTGCGCC AGAGCGAGGG CCGCTACGAG TCGCTGTTTC ACGACGCGCC GGTGTTCTTC 
TGGGAAGAGG ACGTGTCGGC CGTGGATCGC CACCTGGCCG CGCTGCGCGC CGAGGGCGTC 
ACCGACATCG CCGCCTACGC CAAGGAGAAT CCCGAGGCGG TGATGGGCTG GGTGTTGCAA 
AACGAAGTCG TCAACGTCAA CGAGGCCGCG CTGCGCGAGT TCGGCACCGA CAGCGTCGAG 
GACCACCGCG ACAGCGTCGG CGAGACGCTG ATGCCCGACA TATTCCCGCA GATCATCGCG 
GCCGTGGTCG CCTACGCCGA GGGCAAGCTG TACTGGCAAT TCGAGGGCCG ATACCGCAAC 
AAGAAGACCG GCGTGCCCTT CGTCGCGCTG TGCCGCTTCG TATTTCCGCG TCCGGGCATG 
ACCTCGCGGC GCATGATCAT GTGCGGCATC GATATCACCG AGCGCAAACG CTCCGAAGAG 
GAGATCAGCG AGCTCAACCG GGCGCTGTCG GAGCGCGCGC ACGAACTCGA GGCCATCAAC 
CACGAGCTCG AGGCGTTCAG CTACTCGGTG TCGCACGATC TGCGGGCGCC GCTGCGCGCG 
ATCGAGGGCT TCAGCCGGCT GCTCTTCGAC CGCTATCACG ATCAGCTCGA CGAGCGCGGC 
CAGAATTACC TCACGCGTGT GCGCGAGGCC GGTCAGCGCA TGAACCTGCT GATCGAGGAC 
CTGCTCAAGC TGTCGCGCAT GTCGCGCAGC GAGATGCACC TCGAATCCTG CGACCTCAGC 
GCCATGGCCG AAGAGACCAT CAGCAACCTG CGGCAAATTT CACCGGAGCG CGAGGTCGAG 
GTGCTCATCG CGCCCGAGGT GCGCGCCAAG GGCGACCCGA CGCTGCTGCG CGCGGTGCTC 
GAGAATCTGC TCGGCAACGC CTGGAAATTC TCGGCCAAGC GCGAACACGC GCGCATCGAG 
TTCGGCGTCA CGATGGAAAG CGGACGGGTG TCCTATTTCG TACGCGACAA CGGCGCTGGC 
TTTGATATGG CGTATCTCGG CAAACTATTC AACGCGTTTC AACGCCTGCA CACGGCCACC 
GAGTTCGAGG GCACGGGCAT CGGCCTGGCT ACGGTGCAGC GCATCGTGCG TCGCCACGGC 
GGCGAGGTCT GGGCCAAGGG CGAGATCGAC GTGGGCGCGA CCTTCGGCTT CTCGCTCGGC 
TGA

Protein sequence

MTNTHEVLAL ADKARASDDI DAYVRASGHS LAAVVHSLDD VRARLGLEAL SGEDPAVLIV 
EAGAWDERAG FADALVSLAR EEGVPVVWLQ DDGHEAPEAF AHSEVVVASS APRELGLAVS 
LAMAQWSAGR AQRTSRELGE ALRQSEGRYE SLFHDAPVFF WEEDVSAVDR HLAALRAEGV 
TDIAAYAKEN PEAVMGWVLQ NEVVNVNEAA LREFGTDSVE DHRDSVGETL MPDIFPQIIA 
AVVAYAEGKL YWQFEGRYRN KKTGVPFVAL CRFVFPRPGM TSRRMIMCGI DITERKRSEE 
EISELNRALS ERAHELEAIN HELEAFSYSV SHDLRAPLRA IEGFSRLLFD RYHDQLDERG 
QNYLTRVREA GQRMNLLIED LLKLSRMSRS EMHLESCDLS AMAEETISNL RQISPEREVE 
VLIAPEVRAK GDPTLLRAVL ENLLGNAWKF SAKREHARIE FGVTMESGRV SYFVRDNGAG 
FDMAYLGKLF NAFQRLHTAT EFEGTGIGLA TVQRIVRRHG GEVWAKGEID VGATFGFSLG