Gene Hoch_2019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2019
Symbol
ID	8544401
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	2788068
End bp	2789726
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	70%
IMG OID	646386722
Product	2,3-dihydroxybenzoate-AMP ligase
Protein accession	YP_003266457
Protein GI	262195248
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1021] Peptide arylation enzymes
TIGRFAM ID	[TIGR02275] 2,3-dihydroxybenzoate-AMP ligase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.6073
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACCCG AGCGTCCGAA TTCGCCAGCT CTCAAGGGCT GGACCCCGTG GCCGGCGGCG 
TATGCCGCCG CCTATCGCCG CGCCGGCTAC TGGCGCGGCG ATACCTTTGA CAAGATGCTG 
CGCGAGCGCG CCCAGGAGCA CGGCGAGCGC GAGGCCGTGG TCGATGGCCT GCGACGCCTG 
AGCTACCGTG CGCTCGATGA GCGGGCTTCG CGTCTGGCGG TGGGATTTCG GACGCTCGGC 
ATCGAGCCTG GCGCGCGCGT GGTGGTGCAG CTCCCCAACC GCGTCGAGTT CTTCGAGGTG 
TGTTTCGCGC TGTTCCGCCT GGGCGCGCTG CCGGTGATGG CGCTGCCCGC GCACCGCCGG 
GTCGAGATCG CGTATTTCTG CCAGTTCACC GAGGCCAGCG CCTACGTTAT CGCCGACCGC 
GTGGCCGGGT TTGACTATCG CGCCCTGGCC GACGAGGTGA ACGCCGAGAC CCCAAGCCTG 
CGACACGTCA TCGTCGTGGG CGAGGCCGGC GAGCACACGG CCCTCGAGTC GCTGGTGGCA 
CAGGGCCCGC TGCCGGCGCC GGACTGGCCC GCGCCCGCGC CCGCAGACGT GGCGTTTTTT 
CAGCTCTCGG GCGGCAGCAC AGGCGTGCCC AAGCTCATCC CGCGCACCCA CGACGACTAT 
CTCTACAGCG TGCGCGCCAG CGCCGAGATC TGCCGACTCG ATCGCGACAG CGTGTACCTG 
GCCGCGCTGC CGGCGGCGCA CAATTTCACC CTCAGCTCGC CCGGCAGCCT GGGCGCGCTG 
TATGCGGGCG GGCGCGTGGT GCTTTGCGAG CGACCCAGCC CCGACGACGC CTTTCCGCTC 
ATCGAGCGCG AGCGCGTGAG CATCACCGCG CTGGTGCCAC CGCTGGTGTC GGTGTGGCTC 
GACGCGGCCC GCGCCGGACG CAACGATCTC TCCAGCCTGC AGGTGTTGCA GGTGGGCGGC 
GCCAAGCTCG GCGCCGAGCT GGCGCGGCGC GTGCGTCCGG GCCTGGGTTG CAGCTTGCAG 
CAGGTCTTCG GCATGGCCGA GGGCCTGGTC AACTACACGC GCCTCGACGA CCCCGAGGAG 
CTCATCGCCG AGACCCAGGG GCGTCCGATC TCGCCGGATG ACGAGATCCG CGTGGTCGAC 
GACGACGATC GCGAGCTCGA GATCGGACAA GTGGGCCATT TGCTCACGCG CGGACCGTAC 
ACCATTCGCG GCTACTACAA GGCCGATGCG CACAACGCGC GCGCGTTCAC CAGCGACGGC 
TTCTACCGCA CCGGCGACCT GGTGCGGCTC ACGCCCGAGG GCTATCTGGT GGTCGAGGGC 
CGGGCCAAGG ACCAGATCAA TCGCGGCGGC GAAAAGATCG CGGCCGCCGA GATCGAGAAC 
CATCTGCTCG CCCACCCCGA GGTGCTCGAC GCCGCCATCG TCGCCATGCC CGACGCGTTT 
CTCGGCGAGC GTTCGTGTGC CTTCGTCATC GCCCGCGACC AGCCGCCGCG CGCACGCGCG 
TTGCTCGCCT TTCTACGCCA GCGCGGCCTG GCCGCCTTCA AGATTCCCGA CCGCGTCGAA 
TTCGTCGACG CCTTTCCCAA GACCAGCGTC GGCAAGGTCG ACAAACGCGC GTTGCGCGCT 
CGCATCACCG AGCTGCTCGC GGCCCGCGCG TCGGCCTGA

Protein sequence

MQPERPNSPA LKGWTPWPAA YAAAYRRAGY WRGDTFDKML RERAQEHGER EAVVDGLRRL 
SYRALDERAS RLAVGFRTLG IEPGARVVVQ LPNRVEFFEV CFALFRLGAL PVMALPAHRR 
VEIAYFCQFT EASAYVIADR VAGFDYRALA DEVNAETPSL RHVIVVGEAG EHTALESLVA 
QGPLPAPDWP APAPADVAFF QLSGGSTGVP KLIPRTHDDY LYSVRASAEI CRLDRDSVYL 
AALPAAHNFT LSSPGSLGAL YAGGRVVLCE RPSPDDAFPL IERERVSITA LVPPLVSVWL 
DAARAGRNDL SSLQVLQVGG AKLGAELARR VRPGLGCSLQ QVFGMAEGLV NYTRLDDPEE 
LIAETQGRPI SPDDEIRVVD DDDRELEIGQ VGHLLTRGPY TIRGYYKADA HNARAFTSDG 
FYRTGDLVRL TPEGYLVVEG RAKDQINRGG EKIAAAEIEN HLLAHPEVLD AAIVAMPDAF 
LGERSCAFVI ARDQPPRARA LLAFLRQRGL AAFKIPDRVE FVDAFPKTSV GKVDKRALRA 
RITELLAARA SA