Gene Hoch_4944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_4944
Symbol
ID	8547352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	6818853
End bp	6820406
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	72%
IMG OID	646389618
Product	Aldehyde Dehydrogenase
Protein accession	YP_003269326
Protein GI	262198117
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR02278] phenylacetic acid degradation protein paaN

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.141691
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAGC TGGCCAGTTA CGTCAACGAG CGCTGGGTGG AGGGCACGGG CTCGGCCCAG 
CCGCTGCACA ATCCGGCTAC CGAAGAGATC CTTGCCGAGA CCTCGACCGA GGGCGTCGAT 
TTCGCGGCCG CGATGACGCA CGCGCGCGAG CGCGGCGGCC CGGCCCTGCG CGCGCTCAGC 
TTTGCCCAGC GCGGCGAGAT CCTGCGCGCC ATGGCAAAGA CCATCCACGA CAACCGCGAG 
GAGCTGATCG CGCTGGCCAT CGAGAACGGC GGCAACACCC GCGGCGACGC CAAGTTCGAC 
ATCGACGGCG CCAGCGCCAC CCTGGCCGCG TACGGCGAGC TCGGCGCCGA GATCGGCGAC 
ACCCAGGTGA TGGTCGACGG CGACCCGGTG CAGATCGGGC GCACGGCGCG CTATCAGGGC 
ATGCACCTCT GCGTGCCCCG GCGCGGCGTG GCCGTACACA TCAACGCGTT CAACTTCCCC 
GCCTGGGGCA TGTGCGAAAA GGCCGCGACC GCGCTGCTCG CCGGCATGCC GGTGGTCAGC 
AAGCCGGCCT CGACCTCGGC CATGGTCGCG CATCGCACCA TGGAGCTGTT CGTCGCGGCC 
AAGCTCTTGC CCGAGGGCGC GCTGTCGTTC ATCGCCGGTC AGCCCGGCGA CCTGCTCGCG 
CATCTCCAGG GCCAGGACGT GTTGGCCTTC ACCGGCTCGA GCGGGACCGC GCGCACGCTG 
CGCGGGCTGG GCAGCGTCAT CGACAACTCG GTGCACGTCA ACGTCGAGGC CGACAGCCTC 
AACGCCGCCG TGCTCGCGCC GGATGTCGAC CCATCGTCCG AAACCTTCCA GCTCTTCCTC 
GCCGACATAA GCCGCGATAT CACACAAAAG GCCGGGCAGA AGTGCACGGC CATCCGCCGC 
ATCTTCGTCG CCGAGGCCCT GGCCGAGCGC GCGGCCGAGG CCCTGGTCGA GCGCCTGGCC 
GGCACGGTGG TCGGCGATCC GGCCGACAAG AGCGTGCGTA TGGGGCCGCT GGCCTCGGCC 
GCGCAGCAGC GCGACGTGCG CGCCGGGATC GAGCGCCTGG CCGGGCAGAC CGAGGCCCTG 
TTCGGCGGCG ACGGCGCCTG CGAGCCGGTC GGCGTACCCG CGGGCAAGGG CTACTTCGTC 
GGCCCGGTGT TGCGCCGCGC CAGCGACGCG CGCGCGGCCA CGGCGGTGCA CGATCACGAG 
GTCTTCGGCC CGGTGGCCAC GCTCCTGCCC TTTGCCGGCG GCGCCGAGGA GGCGGCCGAG 
CTGGTCGCGC TGGGCGGCGG CGGGCTGGTG GCCTCGGCGT ACACCGACGA GCGCGACTAC 
GCGCGCGACA TCATCCTCGG CCTGGCGCCC TACAACGGCC GCGTGTACCT CGGCAGCAAC 
AAGATGGCGG CGCAGTCCAT GGGCCCGGGC ACGGTGTTGC CGCAGCTCGT GCACGGCGGC 
CCGGGGCGCG CCGGCGGCGG CGAGGAGCTG GGCGGCCGCC GCGGCATGGC GCTGTATCAG 
CAGCGCACCG CGGTGCAGGG CGACAAGGGC ATGCTCAAGA CCTTCGAGCG CTGA

Protein sequence

MKKLASYVNE RWVEGTGSAQ PLHNPATEEI LAETSTEGVD FAAAMTHARE RGGPALRALS 
FAQRGEILRA MAKTIHDNRE ELIALAIENG GNTRGDAKFD IDGASATLAA YGELGAEIGD 
TQVMVDGDPV QIGRTARYQG MHLCVPRRGV AVHINAFNFP AWGMCEKAAT ALLAGMPVVS 
KPASTSAMVA HRTMELFVAA KLLPEGALSF IAGQPGDLLA HLQGQDVLAF TGSSGTARTL 
RGLGSVIDNS VHVNVEADSL NAAVLAPDVD PSSETFQLFL ADISRDITQK AGQKCTAIRR 
IFVAEALAER AAEALVERLA GTVVGDPADK SVRMGPLASA AQQRDVRAGI ERLAGQTEAL 
FGGDGACEPV GVPAGKGYFV GPVLRRASDA RAATAVHDHE VFGPVATLLP FAGGAEEAAE 
LVALGGGGLV ASAYTDERDY ARDIILGLAP YNGRVYLGSN KMAAQSMGPG TVLPQLVHGG 
PGRAGGGEEL GGRRGMALYQ QRTAVQGDKG MLKTFER