Gene Hoch_5139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5139
Symbol
ID	8547550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	7078249
End bp	7079508
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	72%
IMG OID	646389815
Product	putative glycosyl transferase
Protein accession	YP_003269520
Protein GI	262198311
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.587497
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGATT CGCCCGCGCC CCGCCAGCGC CTGCTCTTCG TGGTCGAGAA TCTCGCCATC 
GCCCAGGTGC TGCGCTCGCT GACCCTGGCG CGCTCGCTCG ATCCCGCGCG CTACGAGGTG 
CACTTCGCGT GCTCGCACTT CGACGAGACG CTGTTCGCGG GCACGGACTT CGTCCGCCAC 
ACCATCTACA CCATCGACCG CGAGCGCGCC TTCGCCGCCC TGGTCAAAGG CAAACGCCTG 
TACGAAAAAC GCGTGCTCGA GCAGTACGTG GACGAGGAGA TCGCGCTCAT TCGCGCGCTG 
CGGCCGGCGC TCGCGATCGG CGATCTGCGC ATGTCGCTGG CGGTGAGCGC GCCGGCCGCG 
CGCACGCCCC TGGCGACGCT GATCAACGCC TTCTGGAGCC CCGACGCGGC CCGCGACGCG 
TTCCCGGTGC CCGAGCATCC CATCGTCAAA CTGGTCGGCA TCGAGACCGC CCAGCGCTTC 
TTTCCCAAGG CGCTGCCCAC GGCCTTTGCG CACTTCGCCG CGCCCGTGAA CGCGCTGCGC 
AAACGCCACG GCCTGGCGTC GCTGGGCTCG CTGCCCGAGG TCATCAGCTT CGGCGATCAC 
GTCCTGTTCC CGGATGTCCC CGAGCTGGCT CCGGTGCGCG TGCGGCACCC GCATCAGCGC 
TACATCGGGC CGATCCTGTG GTCGTCGCGG CTGCCGCTGC CGCCGTGGTG GGACCAGCTC 
GACCGCGAGC GCCCGCTGGT GCACGTGTCG CTCGAGCCCG GCGGTCCCAT CGACGCCCTG 
CCCGCGGTGC TCGAGGCGGT GCGCGATATG CCCGTCAACC TGAGCCTGTG CACGGCCGGG 
CGCACGCCGC CGCGCGGGCT GCCGGCGAAT GTCCACGCCG CGCCGCTGCC GCTGGTCGAG 
GCCGCGCAGC GCGCCGCGCT GGTGATCTGC AACGGCGCCG AGTCGAGCAG CTACCGCGCG 
CTGGCCGAGG GCGCGCCCGT CATCGGCATC GCCTGGAACT TCGATCAATA CCTGGCCATG 
GACGCCATCG AACGCGCCGG CGCCGGGCTC ACGGTGCGCG CCGGCAGCGT GAGCGCCGAC 
CTGGTGCGCG CGGCCGTCGA GCGCGTGCTG GCGCAGCCCA GCTTCACCGA GCGCGCGCGC 
GATCTCGCCG CGGCCATGCA GGCGCTGTCG GCGCGCGAGC AGTTCGCGGC CTTTCTCGAG 
GAAGTCCTCG GCGCGGGCGC CCAGCACAGC GCTGCGGCAC ACGCCCGGCT GCCAGTCTGA

Protein sequence

MPDSPAPRQR LLFVVENLAI AQVLRSLTLA RSLDPARYEV HFACSHFDET LFAGTDFVRH 
TIYTIDRERA FAALVKGKRL YEKRVLEQYV DEEIALIRAL RPALAIGDLR MSLAVSAPAA 
RTPLATLINA FWSPDAARDA FPVPEHPIVK LVGIETAQRF FPKALPTAFA HFAAPVNALR 
KRHGLASLGS LPEVISFGDH VLFPDVPELA PVRVRHPHQR YIGPILWSSR LPLPPWWDQL 
DRERPLVHVS LEPGGPIDAL PAVLEAVRDM PVNLSLCTAG RTPPRGLPAN VHAAPLPLVE 
AAQRAALVIC NGAESSSYRA LAEGAPVIGI AWNFDQYLAM DAIERAGAGL TVRAGSVSAD 
LVRAAVERVL AQPSFTERAR DLAAAMQALS AREQFAAFLE EVLGAGAQHS AAAHARLPV