Gene Hoch_3122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3122
Symbol
ID	8545510
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	4296079
End bp	4297701
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	71%
IMG OID	646387789
Product	PAS/PAC sensor hybrid histidine kinase
Protein accession	YP_003267517
Protein GI	262196308
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.340394
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.912648
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGACG AGCGCACCGA ACTAGAGATT GTCCGTCAAC AACTAGCAGA GGCTCACGCC 
ACGCTCGATG CCATCCGCTG CGGCGAGGTC GACGCGGTGA TGGTCGATAC CGGTGACGCC 
CACGAGGTGT TCACGCTTCA GCCCGCCGAT CTGCCGTATC GCGAGTTTCT CGAGCGCATG 
GCCGAGGGCG CGCTGTCGCT CGACGCCGAT GGTCTGGTGC TGTACTGCAA CCAGTTTTTG 
TGCGGGCTGC TGGGCCTGGG GCGTGAGCAG CTCACCGGCC GGCCCTTCTC CTCGTTTGTC 
CTCGAGGGCT CGCGCTCCGA GTTCGAGGCC GCGCTGGCGG CCAGCGACAG CGGCAGCGTG 
GCCGTGACCC TGCGCGGCGC CGGCGAGCGC CGTGTGCCCG TGCTGCTCAG CTACACGCCG 
GTGGGCGGCG GCGAGCGCCG GCGCACCAAC CTGGTGGTCT CCGATCAGCG CATCCGCCGG 
CGGCTGCAGA CCGTGAGCGC GGCCCGCGAC GCGGCCGAGG CCGCGAGCAC GGCCAAGGAC 
CGCTTTCTGG CCGTGCTCGG GCACGAGCTG CGCAATCCTC TGGCCGCGCT CACCAGCAGC 
GTCGAGCTGC TCGCGCACGG CGCGATCGAC GACCAGCGGC GCGACTGGAT CCACGACAGC 
ATGGCGCGTC AGCTCGCCCA GCTCCGCTCG CTGGTCGACG ACCTGCTCGA CGTCACCCGC 
ATCGCCCAGG GCAAGATGGT GCTGCGCAAG GCGCCGGTGG ACATCGCCAG CGTGGTCGCC 
GACGCCCTCG AGTCGGTGTC CTCGCTGGTC AACGCGCGCA AGCACACGCT GGTGTGCGAG 
CCCATCGTCG AGCGTCTCGA GGTGTTTGGC GACCGCACCC GGCTCGAGCA GGTGATCGTC 
AACCTGGTGG CCAACGCCGC CAACTACACC GAACCCGGCG GCCGCATCGA GCTCAGCGCC 
AGGCGCGAGG GTGAGCACAT CCGCGTCGCG GTGGTCGACA CCGGCGTCGG CATCGACGCC 
GCCGACATCG AGCACATCTT CGAACCCTTT GCCCAGGTCG GCGAGGCCGG CAGCGGCGGC 
CTAGGCATCG GCCTCACCCT GGTGCGTCAG CTCGTCGAGC TGCACGGCGG CACGGTCGAG 
GCCGAGAGCG GGGGTCACGG CCAGGGCACG ACCTTCCGGG TGAGCCTGCC GCAGGGTGGC 
GAGCAGCCGG CGCCGGAGCC CAGACCCAAC CCGGGCCAGC TCCCGCGCGG GCTGCGCGTG 
GTGGTGGTCG ACGACAACGA GGACTCGGCC CAGCTCATGG CGCTGCTGCT CGCGGGCTAC 
GGGCTCGAGG TCGAGAGCGT GCACCGCGGC ACCGAGGTGC TGCCCGCGGT CGAGCGCCAC 
CGCGCCAAGC TGGTGCTGCT CGACCTCGGC TTGCCCGATA TCTCCGGCTA CGAGGTCGCC 
CAGCAGCTCC GCCAGGCCGG CCACGACGAG CTGGTCATCG TCGCGCTCAC CGGCTTCTCG 
CACGCCAGCG CCCGCCAGCG CGCCGAGCAG GCCGGCTGCG ACGCGCACGC GGTCAAGCCG 
CTCAAGGCCG CCCAGCTCGC GACCATGGTG GCGCGCTTCC ACGAGCGCCT CAAGGTCGAC 
TGA

Protein sequence

MSDERTELEI VRQQLAEAHA TLDAIRCGEV DAVMVDTGDA HEVFTLQPAD LPYREFLERM 
AEGALSLDAD GLVLYCNQFL CGLLGLGREQ LTGRPFSSFV LEGSRSEFEA ALAASDSGSV 
AVTLRGAGER RVPVLLSYTP VGGGERRRTN LVVSDQRIRR RLQTVSAARD AAEAASTAKD 
RFLAVLGHEL RNPLAALTSS VELLAHGAID DQRRDWIHDS MARQLAQLRS LVDDLLDVTR 
IAQGKMVLRK APVDIASVVA DALESVSSLV NARKHTLVCE PIVERLEVFG DRTRLEQVIV 
NLVANAANYT EPGGRIELSA RREGEHIRVA VVDTGVGIDA ADIEHIFEPF AQVGEAGSGG 
LGIGLTLVRQ LVELHGGTVE AESGGHGQGT TFRVSLPQGG EQPAPEPRPN PGQLPRGLRV 
VVVDDNEDSA QLMALLLAGY GLEVESVHRG TEVLPAVERH RAKLVLLDLG LPDISGYEVA 
QQLRQAGHDE LVIVALTGFS HASARQRAEQ AGCDAHAVKP LKAAQLATMV ARFHERLKVD