Gene Hoch_4545 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_4545
Symbol
ID	8546950
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	6204124
End bp	6205275
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	64%
IMG OID	646389219
Product	glycoside hydrolase family 16
Protein accession	YP_003268930
Protein GI	262197721
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2273] Beta-glucanase/Beta-glucan synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACGC TCTATATCGC ACTCGCAGCG GCTCTGTCGC TTCTCTATGT CAACGAGGCC 
AACGCCCAGA GCTGGCAACT GGTCTGGGCC GATGAATTCA ACGGCAGCAT CAGCTCCGAC 
TGGGTATTCG AAACTGGCAC GGGTTCCAGT GGTTGGGGCA ATAACGAATT GCAGTACTAC 
CGCCGTGAAA ACGCCACCGT GGAGAACGGC AACCTGGTGA TCACGGCGCG GCGCGAGAAC 
TTCGGCGGCC GCAATTACAC CTCGGCACGT ATGAAAACCC AGGGTCGCAA GACCTTCCGC 
TACGGCCGCA TCGAGGCGCG CATCGCGCTG CCCACGGGCT CGGGTCTGTG GCCGGCGTTC 
TGGATGCTCG GCAGCAACAT CAGCTCAGTG GGCTGGCCGG CCTGCGGCGA GATCGACATC 
ATGGAGCACG TCAACAGCAA CAACGTCGCC CACGGCACCA TCCACTGGCA GGATCACAAC 
GGCAACTACG CCAACTACGG CGGTCACACC TCGACCAACG TGAACAACTA TCACGTCTAC 
GCCATCGAGT GGGACGACCG CGGCATCCGC TGGTTCCTCG ACGGCCAGCA GTACCACGAG 
GTGAACACCT CGGGCGGTGT CAACGGCACC CACGAGTTCC ACAACGACTA CTTCCTGCTG 
CTGAACATGG CCGTCGGCGG TAACTGGCCC GGCTTCACGG TCGACGAGGG CCGCCTGCCC 
GCGCGCATGC TGGTCGACTA CGTGCGCGTG TACCAGGGCG GCGGTGGCGG CGGCGGCTTC 
TCGCTGCACC GCGAGGCCGA GACCTACTCG TCGATGAACG GCGTGGACCT CGAGGGCTGC 
TCGGAGGGTG GCCAGAACGT CGGCTGGATC GATCAGGGCG ACTGGATGGC CTACGGCGGT 
ATCAACATCC CCAGCGCGGG TACCTACGTC ATCCGCTACC GCGTCGCCAG CCCCGGCGGC 
AGCGTGCTGT CCTCGGATCT CAACGCCGGC TCGATCCCGC TCGGCAACGT CAACATCCCG 
GCCACCGGCG GCTGGCAGAA CTGGACCACG GTGTCCCAGA CCGTGTCTCT CAACGCCGGC 
ACCTACGACT TCGGCATCTT CGCCCAGCAG GGCGGTTGGA ACCTCAACTG GTGGAGCATC 
GAGCGCCAGT GA

Protein sequence

MKTLYIALAA ALSLLYVNEA NAQSWQLVWA DEFNGSISSD WVFETGTGSS GWGNNELQYY 
RRENATVENG NLVITARREN FGGRNYTSAR MKTQGRKTFR YGRIEARIAL PTGSGLWPAF 
WMLGSNISSV GWPACGEIDI MEHVNSNNVA HGTIHWQDHN GNYANYGGHT STNVNNYHVY 
AIEWDDRGIR WFLDGQQYHE VNTSGGVNGT HEFHNDYFLL LNMAVGGNWP GFTVDEGRLP 
ARMLVDYVRV YQGGGGGGGF SLHREAETYS SMNGVDLEGC SEGGQNVGWI DQGDWMAYGG 
INIPSAGTYV IRYRVASPGG SVLSSDLNAG SIPLGNVNIP ATGGWQNWTT VSQTVSLNAG 
TYDFGIFAQQ GGWNLNWWSI ERQ