Gene Hoch_2384 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2384
Symbol
ID	8544770
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	3300694
End bp	3302313
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	76%
IMG OID	646387083
Product	N-acetylglucosaminyl transferase-like protein
Protein accession	YP_003266814
Protein GI	262195605
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2956] Predicted N-acetylglucosaminyl transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.40493
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.336988
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCACGC CGTTGACCCT GGCCCTCTCG TGCGTGCTCG CGCTGGTCAT CGGCGTGTTG 
CTGGGGCGCT TCTATGTCCC GGCCAAGCGC GGCTTGGTGC GCGCGGCGCG CCAGGCCGAG 
AGCTACGCCC GGGCCCTCAA CCACACCCTC GAGGACCAGC CCGACGACGC GGTCGAGGCG 
CTGCGCCGCG TGGTCGCCGA GGACACCGAC GATCTCGAGC CGTACTTCGC CCTGGGCGCG 
CTGTTCCGCC GCCGCGGCGA GTGGGAGCGG GCGGTGCGTG TGCACCAGGC CATCGCCATG 
CGCGATCCCA AGAACAAGGC CATCCAGGGG CGCGCGCACT TCGCCCTGGG CCGCGACTTC 
ACCTGCGCCG GCATGCCGCG CCGGGCCACG CGCGCCTTCG AGCAGTGCCT GGTGGTCGAC 
GGCAAACACC AGCCGGCGCT GCGCGCGCTG GTGGCGCTGT ACGAGGAGCA GGGCCGCTAC 
GCCGAGGCCG CCGACGCGCT CGCGCGGCTC GACAAGCTGC GCGAGCAGGG CCCCTCGGCG 
CGCGGCCATC ACCTGCTGGT AGCGGCGGCG CAGTCGGCGC TGCGCGGACC CGCCGCCGAT 
CTCGACCACG CCAGCCGGCT GCTGCGAGAC GCCCGCCGCG GCAAAGCGCA CAGCGTGCAC 
GCGCTGGTCG CCGAGGCCGA GTTGGCGGCC GCGCATCGCG ATCCGGATGC GGCCTGCGAA 
CACCTCCTCG ACGCCGTCGA GATGGCGCCC GAGCTGGCCG CGTTCCTGTT GCCCGGGCTG 
ATCGAGGCCC AGCGCCAGAG CATGCGACGC GAGCGCGGTG ACAGCGCTGA GCTCGCGGTC 
TCGGACGAGG CCGCGGTCGC CGGCGTGGCG GCCAAGCTCG CCGAGCGCCT GGCCACCTCC 
GGGCGCAGCG ATGAACCCTT TGCCGGCATG GCGCTGGCCG AGCTGCGCTC GCACTGCGAT 
CCCGAGGCCG CGCTGGCCGA CTACCGCGAC CTGGCCGAGC GCTTTCCCGA CCTGCTGCCG 
GCGCAGGTGG CGGCCGCCCG CATGGCGCTG GCCGCGGGCG ACGAGGGCGA GATCCGCGAC 
GCCCTGCGCC GCTTGAGCGC GGCCGACGGC GTGCTCGCTT GGGCCATGGA GGGCGCCTGG 
CGCTGCAGCG GCTGCGGCCA TCGCCAGGAC CTGTTTTTCT GGCGCTGCCC CGCGTGTCGC 
GCCTGGGGCA GCGTGCGCCT CGAGCTCGGG CGCGAGGCGC TGGCGCCGCC GCCGCCGCCG 
CCCTGGGACG AGCCCGCGCT GGTCCGCGGC GGTGTCGATG CCGCGCTCTC GGGTGCGGCC 
GCGAGGCGTA CCCGGGCCTC GGCGATGGTG GCTGCGGGGG CCTCGGCCTC GCACCAGGCC 
GCGCCCTGGA TCGACGCCTC CTCGGGCTCG AGCCGCAGCG CCTCGCTGTG GAGTCGCGTG 
GGCGCGTGGT TCGGTGGCGT GGGCGCATCG CAGGCGCCCG CCGAGCCGGT CGCCAAAGCC 
CCCGCCGGCG CGGCCGCGAG CCCGCGCCCG AGCCCGCCCG CGACGGTCCC GGCGTGGCGC 
GAGGACGGCG CGGCCGCCGA CGCTGCGGCC GCCGACAACG CAGAGCAGAG TAGCGTATGA

Protein sequence

MITPLTLALS CVLALVIGVL LGRFYVPAKR GLVRAARQAE SYARALNHTL EDQPDDAVEA 
LRRVVAEDTD DLEPYFALGA LFRRRGEWER AVRVHQAIAM RDPKNKAIQG RAHFALGRDF 
TCAGMPRRAT RAFEQCLVVD GKHQPALRAL VALYEEQGRY AEAADALARL DKLREQGPSA 
RGHHLLVAAA QSALRGPAAD LDHASRLLRD ARRGKAHSVH ALVAEAELAA AHRDPDAACE 
HLLDAVEMAP ELAAFLLPGL IEAQRQSMRR ERGDSAELAV SDEAAVAGVA AKLAERLATS 
GRSDEPFAGM ALAELRSHCD PEAALADYRD LAERFPDLLP AQVAAARMAL AAGDEGEIRD 
ALRRLSAADG VLAWAMEGAW RCSGCGHRQD LFFWRCPACR AWGSVRLELG REALAPPPPP 
PWDEPALVRG GVDAALSGAA ARRTRASAMV AAGASASHQA APWIDASSGS SRSASLWSRV 
GAWFGGVGAS QAPAEPVAKA PAGAAASPRP SPPATVPAWR EDGAAADAAA ADNAEQSSV