Gene Hoch_3878 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3878
Symbol
ID	8546274
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	5335997
End bp	5337187
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	71%
IMG OID	646388550
Product	serine/threonine protein kinase
Protein accession	YP_003268270
Protein GI	262197061
COG category	[K] Transcription [L] Replication, recombination and repair [R] General function prediction only [T] Signal transduction mechanisms
COG ID	[COG0515] Serine/threonine protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.683762
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.402263
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGAAAG CCCAGCGTCA GAAGAGTGGT TACTTCGCTA CTGCCGTCAG CACCTTTGAT 
TGTTCGGTGG CGGCGGCCCG GCGTGACGCG CCCATGCAGG CGCCATTTCT GGCCCACGGC 
AGCCCCCGCG ACGGCCTGGG CGGGACCGCG CCCACGCAGA CCCCGAGCCG TGGGGAACCG 
ACACGGGTGC TGCAGCCCGG CACGGTCATC GCCGGCCTGT ATCGCATCGA CGATCTGCTC 
GGCACCGGCG GCATGGGCCA GGTCTACGCC GCCACGCAGC TCCTCACCGG CGTGCACTAC 
GCGCTCAAGG TGTGTCACCC GGGCATCCCG GCCGAGATCC TCGACGCCGA GGTGCGCGCG 
CTCGAGGCGG TCCTGCATCC CGGCATCGTG CGCGTGCACG CCACCGGTAG CCACGAGGGC 
ATCCCGTTCC TGATCATGGA GCGCATCTAC GGCAGCACTC TGCGCCAGCA CCTGCACGAG 
GCCGAGGCCG AGAACCTCGC GTGCGGTCGC GCCGCGCCGC GCATGCCGGT CGAGCGTGTC 
ATTTCGATCC TGGCGAGCAT CGCCGACGCG CTGGCCGTGC TGCACGAGCA CGGCTTCGTC 
CACCGCGACC TCAAGCCCTC GAACATCATG CTCACCAGCG ACGATCGCCC GGTGCTGCTC 
GATCTCGGCG TCTCCTGCCA GAGCATCGAG GCCGAGCACG AGCGCCGCCT GGCCGGCTCG 
CCGCACTACA TCGCGCCCGA GGTCATCACC GCGTCGATCG CCAAGCATCA GGCGCCGTGC 
ATCGACATCT ACGCGCTCGG CGTCATCGCC TTCGAGATGC TCACCGGCGC GCGCCCCTTC 
GACAGCCACA CGCAGCTCGA TCCCCTGCGC CAGCAGCTCC ACGCGGTCCC GCCGCGGGTG 
AGCGAGCTGG TCGCCGAGGT GCCCCAGGGC CTCGAGCACC TCATCGAGGA GATGCTGCGC 
AAAGAGGCCG ACGAGCGCCC GCGCTCGGCC CGCGTGGTGG CCGCGCGTCT GCGCGCGCTG 
CAGCACGCGG CCAACGCCAC TCGCCTGGTG CGCAACGCGC GTCGCCGCCG CCCGAGTATG 
CGCCGCCGTC GCGTCACCGA ATCGGTCGTG CTCTCGAACT CGCTGTGCGG TCGCCCGACG 
CTGCCGCCGC GCCCCATGCG CCGCGTGCGC CGCAGCCCCA AGGCCGAGTG A

Protein sequence

MWKAQRQKSG YFATAVSTFD CSVAAARRDA PMQAPFLAHG SPRDGLGGTA PTQTPSRGEP 
TRVLQPGTVI AGLYRIDDLL GTGGMGQVYA ATQLLTGVHY ALKVCHPGIP AEILDAEVRA 
LEAVLHPGIV RVHATGSHEG IPFLIMERIY GSTLRQHLHE AEAENLACGR AAPRMPVERV 
ISILASIADA LAVLHEHGFV HRDLKPSNIM LTSDDRPVLL DLGVSCQSIE AEHERRLAGS 
PHYIAPEVIT ASIAKHQAPC IDIYALGVIA FEMLTGARPF DSHTQLDPLR QQLHAVPPRV 
SELVAEVPQG LEHLIEEMLR KEADERPRSA RVVAARLRAL QHAANATRLV RNARRRRPSM 
RRRRVTESVV LSNSLCGRPT LPPRPMRRVR RSPKAE