Gene Hoch_5037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5037
Symbol
ID	8547447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	6948798
End bp	6950516
Gene Length	1719 bp
Protein Length	572 aa
Translation table	11
GC content	70%
IMG OID	646389712
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_003269418
Protein GI	262198209
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.565725
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGACA AGCAGTTCGA CGCTGTAATC GTGGGTTCGG GGTTTGGCGG CGCGGTGATG 
GCTTATCGAC TGGCCGAGGC CGGGCTGCGG GTGTGTGTGC TCGAGCGTGG CAAGAAGTAT 
CCGCCGGGTT CGTTTCCGCG CACGCCGGCG GCGCTGAGCC GCGCCACCTG GGACCCGGAC 
GCGGGCAAAC AGGGCCTCTT CGATATCTGG TCCTTCCGCA CCATGGACGC GGTCACGGCC 
AGCGGTCTGG GCGGCGGCTC ATTGGTCTAC TCCAACGTGC TGCTGCGCAA GGACGAGCGC 
TGGTTCGTGA CCGAGGGCAC CACGCCCGGC GTGTTCGAGC ACTGGCCCGT GAACCGCGCC 
GACCTCGACC CGCACTACGA CGCGGTCGAG AAGGTGCTGC GCCCCAAGCC CTATCCCTTT 
GCGCAAGAGC CCTACGCGGA CACACCCAAG ACCCACGCGA TGCGCGACGC GGCCGCGGCC 
GTGCGCGACT GCGAGTGGTT CCTGCCGCCG CTCACGGTCA ACTTCGCGCC TTCGGACAAG 
CGTCCGGGTG TGCCCTTCGA GGGCCCGCCC GATATGCACG GCGAGCCGCG CTCGACCTGC 
CGGCTGTGCG GCGAATGCAA TATCGGCTGC AACTACGGCA GCAAGGACTC GCTCGACTTC 
AACTACCTGT CGATGGCGCA ACGCGCGGGC GCCGAGCTGC TCACCCGCGC CGAGGTGCTG 
TCCTTCGAAC CCGCCGGCGC CTACGGCTAC CGGGTCAACT ACGTCGAGCA CACGCCCGCG 
CTCGAGGGCC GTCCGTACCG GCGCTCGGAT CTGCCGACGC ATACCATCCG CGCCAAACGC 
CTGATCCTGG CCGCCGGTGC CCTGGGCAGC ACGGCGCTGC TTCTGCGCAT GCGCCGCGAC 
AGGGAGGCAT TTGGCAAACT CAGCCGCATG CTCGGCCACC GCTTCAGCGG CAACGGCGAC 
CTGCTGACCA TGGCCCTGCA CTGCTGCGAC CGCGACGACC ACCGCGGGCC GCGGCGCATC 
GACGCCAGCT TCGGGCCGGT GATCACCAGC GCCATCCGCG TCACCGATGC CCTCGATTCC 
CCCACGCGGC CGCCCCACGA CACGGTCCAC GAGCGCGGCC TGTACATCGA AGACGCCGGC 
TTTCCCGCGT TCTTGGCCTG GGTGCTGGAG AGCGCGCCGG TGCCCAGCAC CATCGGCCGC 
GCGCTCGGGT TCGCGCACCG CTACTTGGCC GGACACCTGG GCTTCAACTC CGATACCAAC 
CTCAGCGCCG AGCTGTCCGA ATTCATCGGC GATGCCCGCC TCACCGAGAC CTCGCTGCCG 
TTTCTGTGCA TGGGCCGCGA TGTCGCCAGC GGGGTCATGC ACGTCGACGC GGGCGACAAT 
CTCGACCTGC ACTGGAGCAT GGACGACTCG GCCGAATACA TCGATCGCGT GCGCCAGATG 
ACCCAGCGCC TGGCCGACGC GCTCGGCGGC TACCACGCCG ATAATCCGCT GTGGCGGCTG 
CGCCGCTTCA TCACCGTGCA CCCGCTGGGC GGCTGCCCCA TGGGCCGCCA CGCAGGCGAG 
GGCGTGGTCG ATAGCTGGGG CCACGTGTTC GGCTACCCCG GCCTGTACGT GGCCGACGGC 
GCCACCATGC CGGGCCCGGT GGGCGCCAAT CCCTCGCTCA CCATCGCCGC GATGGCCGAC 
CGCTGCGCCG ACGGCATCCT GCGCGAACTG GGCCGCTGA

Protein sequence

MRDKQFDAVI VGSGFGGAVM AYRLAEAGLR VCVLERGKKY PPGSFPRTPA ALSRATWDPD 
AGKQGLFDIW SFRTMDAVTA SGLGGGSLVY SNVLLRKDER WFVTEGTTPG VFEHWPVNRA 
DLDPHYDAVE KVLRPKPYPF AQEPYADTPK THAMRDAAAA VRDCEWFLPP LTVNFAPSDK 
RPGVPFEGPP DMHGEPRSTC RLCGECNIGC NYGSKDSLDF NYLSMAQRAG AELLTRAEVL 
SFEPAGAYGY RVNYVEHTPA LEGRPYRRSD LPTHTIRAKR LILAAGALGS TALLLRMRRD 
REAFGKLSRM LGHRFSGNGD LLTMALHCCD RDDHRGPRRI DASFGPVITS AIRVTDALDS 
PTRPPHDTVH ERGLYIEDAG FPAFLAWVLE SAPVPSTIGR ALGFAHRYLA GHLGFNSDTN 
LSAELSEFIG DARLTETSLP FLCMGRDVAS GVMHVDAGDN LDLHWSMDDS AEYIDRVRQM 
TQRLADALGG YHADNPLWRL RRFITVHPLG GCPMGRHAGE GVVDSWGHVF GYPGLYVADG 
ATMPGPVGAN PSLTIAAMAD RCADGILREL GR