Gene Hoch_1599 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1599
Symbol
ID	8543981
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	2189210
End bp	2190346
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	70%
IMG OID	646386307
Product	polyA polymerase related protein
Protein accession	YP_003266042
Protein GI	262194833
COG category	[R] General function prediction only
COG ID	[COG4639] Predicted kinase
TIGRFAM ID	[TIGR00277] uncharacterized domain HDIG

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.29317
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGTGC TCGCCCACTG CCCCGCGCCC CCGCACTGGC GGCTCGACTG GCGCGCGCTG 
CGCGACGCTT ACCCCTGGGT CGATGCGCTG CACGCGTGCC CGCAGGATCC CGGCTTTCAC 
GCCGAGGGCG ACGTCGGCAT CCACACCGAG ATGGCGTGCC AGGCGCTGGC CGCCTCGGCC 
GCATTTCGCG CCCTCCCCGC GGAAGAACGC GCGATCGTGT TCGCCGCCGT GCTCTTGCAC 
GACGTCGCCA AACCCGCGTG CACCAAACAC GAGGACGACG GCCGCATCAG CTCGCGCGGC 
CACAGCGGCC GCGGCGATAT CCTGGCGCGG CGCATCCTGT GGCGGCAGGG CGTGCCCTTT 
GCCACCCGCG AGGCCATCTG CGGGCTCATC CGTCATCACC AGGTGCCGTT TTTCCTGGTC 
GATCGCGAGG ACTCTCGCAA GCTCGCCTAT CGCGTCAGCC ACATGGCGCG CTGCGATCAC 
CTCGCGCTGG TGGCCTGGGC CGACGGCTTC GGCCGACGCT GCGCCGACGA CGCCGACCAG 
CGCCGCATCC TCGACAACGT CGAGCTGTTC CGCGAGTACT GCGACGAACA GGGCTGCCTC 
GCGCAGCCGC GGCGCTTCGC CTCAGACCAC TCGCGCTTTC TCTACTTCCA CAAGGACAGT 
CGCGACCCCG ACTACCACGC ACACGATGAC ACCGGCTGCC AGGTGACGCT GATGTCGGGC 
CTCCCCGGCG CCGGCAAAGA CCACTGGATC CGCCACGCTG CCGGCGATCT GCCCGTGGTC 
TCACTCGACG CCATCCGCCT CGAACGCGGC ATCGACCCGG CCGCACCGCA GGGCCGCGTC 
ATCGACGAGG GCCGGCAGCG CGCCAAAGAA TACCTGCGCC GCCAGCAGTC CTTTGTGTGG 
AACGCGACCA ACCTCAGCCA GCAGATCCGC GACCAGCTCA TCGCGCTGTT CAACGACTAC 
GGCGCCCGCG TGCGCATCGT CTACGTCGAG GCGTCCGAAA CCCACATCCG CAGCCGCAAC 
CGCGCCCGCG AGAGCCCCGT GCCGTCGCGG GTCATCGACA AGCTGCTCGA GCGCTGGACC 
GTGCCCACCA CCGTCGAGGC CCACGAGATC GTCTGTCACG TGGACGCCGA CCAATAG

Protein sequence

MSVLAHCPAP PHWRLDWRAL RDAYPWVDAL HACPQDPGFH AEGDVGIHTE MACQALAASA 
AFRALPAEER AIVFAAVLLH DVAKPACTKH EDDGRISSRG HSGRGDILAR RILWRQGVPF 
ATREAICGLI RHHQVPFFLV DREDSRKLAY RVSHMARCDH LALVAWADGF GRRCADDADQ 
RRILDNVELF REYCDEQGCL AQPRRFASDH SRFLYFHKDS RDPDYHAHDD TGCQVTLMSG 
LPGAGKDHWI RHAAGDLPVV SLDAIRLERG IDPAAPQGRV IDEGRQRAKE YLRRQQSFVW 
NATNLSQQIR DQLIALFNDY GARVRIVYVE ASETHIRSRN RARESPVPSR VIDKLLERWT 
VPTTVEAHEI VCHVDADQ