Gene Hoch_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_0020
Symbol
ID	8542390
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	23070
End bp	24242
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	69%
IMG OID	646384808
Product	Saccharopine dehydrogenase (NAD(+), L-glutamate- forming)
Protein accession	YP_003264555
Protein GI	262193346
COG category	[S] Function unknown
COG ID	[COG3268] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.947878
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGACA AACGCGACTT CGACGTGGTG GTTTTCGGCG CCACCGGCTT CACCGGACGG 
CTCGTGGCCG AGTATTTGAC CCGCAAGGCC ATGCCCGAGC TGCGCTGGGC CATCGCCGGC 
CGCAGCCGCG ACAAACTCGA GCGCGTGCGC GCCGAGCTGG CCAAGATCGA CCCCGGCGCC 
GCCGACATCG GCGTGCTCGA GGCCGACGCC CGCGACTGGG CCTCGCTGGC GGTGATGGCC 
AACAAGACCC GCGTGGTGCT GACCACCGTC GGGCCCTACA TCGACGACGG CATCCAGCTC 
GTGCGCGCCT GCGTGGCCAG CGGCACCGAC TACGTCGACA TCACCGGCGA GCCCCTGTTC 
GTGAATGAGG TCGTGTCCAA GTACGACGCG CCCGCGCGCG AGCAGGGCGT GCGCATCGTC 
AACTGCTGCG GCTTCGACAG CATCCCGCAC GACCTCGGCG TGATGTACAC GATCGACCAG 
CTCGAGGCCA AAGGCCCGGT CGAGATCGAG GGCTTCGTGC GCGTGCGCGG CAACTTCTCG 
AGCGGCACCA TCCGCTCGGC CATCAAGTCG ATGGCGCAGA TGAACAAGCT CAAGGGCGAC 
GCCTCGGTGC GGCCGCAGCC GAGCACCGAG GGCCGCCGCG TGCGCAAGCT GCGCGCGCGC 
TTGCACCACG ATCCGCGCAT GCAGTCGTGG ACCATGCCGA TGATGACCAT CGACTCGTGG 
ATCGTGCGCC GCAGCGCGGC CATGCTCGAC AGCTACGGAT CCGACTTCGC GTACGCGCCC 
TACATCTGCC AGACCAAGCT GAGCAGCGTC GGCAAGCTCA CGCTCGGTGT CGGCGCCGTG 
ATGCTGCTGT CGCAGTTCCG GCCCACGCGC GAGATGCTGC TGGCGCGCTT TCCCTCGGGC 
AAAGGCCCCA GCGAGGAGGA CATCGCCCAC GGTCGCTTCG AGCTCACCTT CTTCGCCCGC 
AGCGGCGACA GCGAGCTGAT CACGCGCGTC TCGGGCGGCG ACCCGGGCTA CGGCGAGACC 
AGCAAGATGG TCGCCGAGTC GGCCCTGTGC CTGGCCTTCG ACCGCGACCG CCTGCCCGAA 
CGCACCGGCG TGCTCACGAC CGCGACCGCC ATGGGGCAGC CGCTGCTCGA GCGCCTGCAA 
GCGGCCGGCA TCGACTTCGA AGTCGTCGGC TAA

Protein sequence

MADKRDFDVV VFGATGFTGR LVAEYLTRKA MPELRWAIAG RSRDKLERVR AELAKIDPGA 
ADIGVLEADA RDWASLAVMA NKTRVVLTTV GPYIDDGIQL VRACVASGTD YVDITGEPLF 
VNEVVSKYDA PAREQGVRIV NCCGFDSIPH DLGVMYTIDQ LEAKGPVEIE GFVRVRGNFS 
SGTIRSAIKS MAQMNKLKGD ASVRPQPSTE GRRVRKLRAR LHHDPRMQSW TMPMMTIDSW 
IVRRSAAMLD SYGSDFAYAP YICQTKLSSV GKLTLGVGAV MLLSQFRPTR EMLLARFPSG 
KGPSEEDIAH GRFELTFFAR SGDSELITRV SGGDPGYGET SKMVAESALC LAFDRDRLPE 
RTGVLTTATA MGQPLLERLQ AAGIDFEVVG