Gene Hoch_4844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_4844
Symbol
ID	8547251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	6627809
End bp	6629332
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	66%
IMG OID	646389517
Product	PAS/PAC sensor hybrid histidine kinase
Protein accession	YP_003269226
Protein GI	262198017
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0550144
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.563731
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAAAA GTCTGTTGCA GCCACAAAGT CCGGACGAGC GGCGGAAACG CATGGAGTTG 
GTTCTGGAAG GGACTCGCCT GGGCATGTGG GATTGGAACC CGCAGACCAA CGAGGTGATC 
TTCGACGAGC GCTGGGCGGC CATGCTCGGC CACTCGCTCG ATGACCTGGA ATTCACCTAC 
GACGCCTGGT ACAGCCGCGT ACACCCGGAC GACGTCGAGG CGTGTCTGCG CGATATTCAG 
GCCCATTTGA AGGGCGAGAC TGACTTCTAC GAGAACGTCC ACCGCATGCG CCACAAGGAC 
GGGCACTGGG TGCACATCCT CGATCGCGGC CGCATCATGG ACCGCGATGA GCAGGGCCGA 
CCCACCCGTT TTACCGGCGC GCATACCGAT ATTTCCGCGC AGCGCGAGGC GGAGCTGCGC 
GCGCGTGAGC TGGCGCGGGC GCGGACGCAG TTTCTGGCGG TGATGTCGCA CGAGATCCGC 
ACGCCGCTGC ACGGCATGCT GGGCATCACG CATCTGCTCA AGAAGACCGA GCTCTCGGAC 
GAGCAGCAGC GTCTGCTCGA GATCGTCGAG AGCAGCGGCG AGAGCCTGCT GCTGGTCATC 
AACGATATTC TGGATTTCGC CAAGGCCGAC GAGCGTCGGC TGTCGCTGTC GCCGCACGCC 
TTCGAGGTGC GCGCGATGCT CACCGGCATC GCCAATCTGT TCGGGCCGCG GGCGAAGCAG 
AAGGGGCTGC GCTTCTCGTG CACGGCGGCG CCCGGGTTGC AGGGCGCCGC GTGGGGCGAC 
GGGCATCGGC TGCGCCAGAT CCTCATCAAC CTGGTGAGCA ACGCCATCAA GTTCACCGAG 
CGCGGCGGCG TGGCCCTGAG CGCGCGCCGC GAGGGCGAGA GCTTGCATTT CGAGGTGGTC 
GATACCGGCG TGGGCGTGGC CGATACCGAG CGCATCTTTC TCGCCTTCGA GCAGGAGGAC 
GCCTCGATCA CGCGCCGCTA CGCGGGGACG GGCCTGGGTC TGGCCATCGT CCGTCTGCTG 
GCCGAGCAGA TGGGCGGCGA GGTCGGCGTG TCATCGACGG TGGGCGAGGG CAGCCGCTTC 
TGGCTGCGCG TGCCCATGCG CGAGACGCAG ATGCCGCAGA TGGAGGAAGT GAGCCGCGAC 
CAGGTCGAGT CGTTGCCGGC GATGCGCGTG CTGGTCGCTG ACGACAACGC GATCAACCAG 
ATGGTCATCC GCGGCATGCT CGCGGCCGGT GGGCATTTTT GCCAGACGGT GGACACTGGG 
CGGCAGGCGC TGGCCTGCGT CGAGGACAGC GATTGGGACT GTATCTTCCT CGATCTGTAC 
ATGCCCGACA TGGGCGGGGA AGAGGCTGCC GAGCGCATGC GGGCGGCCGG GGTGCGCACG 
CGCATCGTCG CGGCTTCGGC CGATGCCAGC GTCGAGACCC AGGAGCGCTG CCGAGCCAAG 
GGTATACAGG GCTTTCTCAG CAAGCCCTTC AAGCGTCTGC AGTTGCTCGA GGAGTTGCGA 
CAGGCGCACG AAAGCGCGCC CTAG

Protein sequence

MSKSLLQPQS PDERRKRMEL VLEGTRLGMW DWNPQTNEVI FDERWAAMLG HSLDDLEFTY 
DAWYSRVHPD DVEACLRDIQ AHLKGETDFY ENVHRMRHKD GHWVHILDRG RIMDRDEQGR 
PTRFTGAHTD ISAQREAELR ARELARARTQ FLAVMSHEIR TPLHGMLGIT HLLKKTELSD 
EQQRLLEIVE SSGESLLLVI NDILDFAKAD ERRLSLSPHA FEVRAMLTGI ANLFGPRAKQ 
KGLRFSCTAA PGLQGAAWGD GHRLRQILIN LVSNAIKFTE RGGVALSARR EGESLHFEVV 
DTGVGVADTE RIFLAFEQED ASITRRYAGT GLGLAIVRLL AEQMGGEVGV SSTVGEGSRF 
WLRVPMRETQ MPQMEEVSRD QVESLPAMRV LVADDNAINQ MVIRGMLAAG GHFCQTVDTG 
RQALACVEDS DWDCIFLDLY MPDMGGEEAA ERMRAAGVRT RIVAASADAS VETQERCRAK 
GIQGFLSKPF KRLQLLEELR QAHESAP