Gene Hoch_5156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5156
Symbol
ID	8547567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	7102282
End bp	7104177
Gene Length	1896 bp
Protein Length	631 aa
Translation table	11
GC content	69%
IMG OID	646389832
Product	alpha amylase catalytic region
Protein accession	YP_003269537
Protein GI	262198328
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.794447
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCCA CGAAAGGCAC GACTATGCAA TCGCCTCACC TGCTCCGGCC CGGCCATCGC 
GCCGCGTCCA TGTATCCGCC CGCGCGTCCG GTTTCCGCTC CGGCTACGCG CGCTCGGTCC 
CCGCGGCTGA CCCGCGCGGC GGCCGCGCTG CTGGCGCTGC TGGGCCTCGG CGCCTGCGGC 
GGGGCGCCCG CGACCCAGCA GCCCTCCGAG CCCGGCGAGC CGCCCGTAGC GAGCGAGCCG 
GACGCCCGTC CGGGAAGCTT CGCCGACAAC CCGCTGGTGT ACTTCGTCAT CACCGATCGT 
TTTTTCGACG GCAACGCCGA AAACAACCAC TCATACGGCC GCAAAGGCGA CGGTGGCGAC 
GAGATCGGCA CCTTCCACGG CGGCGACCTG GCCGGGCTCA CGACGAAACT CGAAGAGGGC 
TACTTCCGCG CTCTCGGCGT CAACGCCATC TGGATCACGG CGCCCTACGA GCAGATCCGC 
GGCTGGGTAG TCGGCGGCGA CAAGGCGTTT CAGCACTACT CGTACCACGG CTACTACACC 
CTGGATTACA CTGTGCTCGA CCAGAACATG GGCACGCCCG ACGAGCTGCG GCGCTTCGTC 
GACACCGCGC ACGAGCAGGA CATCCGCGTC ATCTTCGACG TGGTCATGAA CCACCCCGGC 
TACGCCGATC TGCAGACCCT CGACGCCTTT GACATCGAGG TGCTGTGGGA GGGCTGGGAA 
TCCGCCACCC TGTCCGATTA TCACAGCTAC ATCGACTACA ACAATTTCGC CTTTACCGAG 
TGGTGGGGGC CGGACTGGAT CCGCGCGGGC TTGCCCGGCT ACCAGGAGGG CAACAGCACC 
GACGACCTGA CCATGCAGCT CGCCTACCTG CCCGACTTCA AGACCGAGTC CGAGCAGCCG 
GTGGGCCTGC CGCCCTTCCT CACCCGCAAG GCCGACACCA AGGCCGTGGC CGTGGACGGC 
TACACCGTGC GCGACTACCT GGTCGCGTGG CTCAGCGCCT GGGTGCGCGA GTACGGCATC 
GACGGGTTCC GCTGCGACAC CGCCAAGCAC GTCGAGCTGG CGGCCTGGTC CGAGCTCAAG 
CAGGCGGGCA CCGAGGCGCT GGCGGCGTGG AAGCAGGACA ACCCGGGCAA GGCCATCGAC 
GACGCGCCCT TCTGGATGAC CGGCGAGGTC TTTCCCCACG GCGTGGTGCG CGACGCGTAT 
TTCGACCAGG GCGGCTTCGA CAACCTGATC AACTTCGACT TTCAGAACCA GCTCGGCGAC 
ATCCTGCGCG GCCCCGCGAG CGAGCGCTGG CAGCGCCTCG ACGACCTGTA CGCCGACTAC 
GCCGCGCAGA TCAGCGACGA CGCCAGCTTC AACGTGCTGA GCTACATCTC CTCGCACGAC 
ACCAAGCTCT TCGATCGCGA GGCCCTGGTG GCGGCCGGTA CCGCGCTGCT GCTGGCCCCG 
GGCGGCGTGC AGATCTTCTA CGGCGACGAG AGCGCGCGGC CGCTCGGTCC CAGCGTGAGC 
AGCGATCCGC AGCAGAACAC GCGCTCGGAC ATGAACTGGG ACGCGCTGGC CGACGATGTG 
CTCGCGCACT GGCAGACCCT GGGCCGCTTC CGCCGCCGCC ACGTGGCCCT GGCCAAAGGC 
ACGCATCAGA AGCTCGGCGA CGCGCCGTAT GTGTTCGCGC GCAGCCGCGA CGACGACGCC 
GTGGTGGTCG CCCTGCTCGG CCAGCTCGGC GAGGCCGGCG CAGATGCGAG CGAGACCGTG 
CGCGTCCCGG TCGGCGACGT GTTCCCGGTG GGCACGCGCC TGCGCGACGC GGCCACGGGC 
GCCCCGCTCG AGGTCGAGAC CGACGCCAGC GGCGGCGCGG TCGCGCTCAC GCCGGGCGCC 
AGCGGCGTGG TCCTGCTCGA GCGCGTCGCG CCCTGA

Protein sequence

MNATKGTTMQ SPHLLRPGHR AASMYPPARP VSAPATRARS PRLTRAAAAL LALLGLGACG 
GAPATQQPSE PGEPPVASEP DARPGSFADN PLVYFVITDR FFDGNAENNH SYGRKGDGGD 
EIGTFHGGDL AGLTTKLEEG YFRALGVNAI WITAPYEQIR GWVVGGDKAF QHYSYHGYYT 
LDYTVLDQNM GTPDELRRFV DTAHEQDIRV IFDVVMNHPG YADLQTLDAF DIEVLWEGWE 
SATLSDYHSY IDYNNFAFTE WWGPDWIRAG LPGYQEGNST DDLTMQLAYL PDFKTESEQP 
VGLPPFLTRK ADTKAVAVDG YTVRDYLVAW LSAWVREYGI DGFRCDTAKH VELAAWSELK 
QAGTEALAAW KQDNPGKAID DAPFWMTGEV FPHGVVRDAY FDQGGFDNLI NFDFQNQLGD 
ILRGPASERW QRLDDLYADY AAQISDDASF NVLSYISSHD TKLFDREALV AAGTALLLAP 
GGVQIFYGDE SARPLGPSVS SDPQQNTRSD MNWDALADDV LAHWQTLGRF RRRHVALAKG 
THQKLGDAPY VFARSRDDDA VVVALLGQLG EAGADASETV RVPVGDVFPV GTRLRDAATG 
APLEVETDAS GGAVALTPGA SGVVLLERVA P