Gene Hoch_5069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5069
Symbol
ID	8547480
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	6989607
End bp	6990857
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	76%
IMG OID	646389745
Product	glycosyl transferase group 1
Protein accession	YP_003269450
Protein GI	262198241
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.338432
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCGTCG GCGTAGTCAC CAGCTCGTAT CCCCGCTGGC CCGGCGACCC GGCCGGAAAT 
TTCGTGGCCG CTCACGCGGG CTGGCTGCGG GATGCCGGAC ACGCGGTCGA GGTCGTGTGC 
GCGGGCGAGC CGGGCGCGCG CGCGCGCTGG CAAGAGGGCG TGCGCGTGTT GCCGGTGGCG 
GCGCGGCCGG GGCTGTTCTA CGCGGGCGGC GCGCCCGAGG CCCTGTCCAT GTCCCGGTCG 
CGGCCGCGAC CGGCGATGGC GGCGGCCGCG CTGGCCTTCT CGCTGTCCCT GCGGCGCGCG 
CTCGCGGAGC GCGCTCACTA CTGGGATGCG GTGTTCGCGC ACTGGCTGTT GCCGAGCGCG 
GCCGCCGCGG TGCTGGCCCT GCCGCGAAGC CGGCGCGCGG TCGCCATCGC CCACTCGGGC 
GACGTGCATC TGGCCCGCGC GCTGGCGCTG TGCACGCCCT TGGCCGCGGC CATGCACGCC 
CGCGGCGATC GCGTGTGTTT CGTGAGCGAA CACGTGCGCG CGCGTTTTCT CGCCGGCGTG 
TGGCCGCGGG GGCTACGCCG AGCGCTGCGG GCGCGCTCGC TGGTGCGTCC CATGGGCGTG 
TCCCTGGCGC GCTGGCAGGC GGCGCGGGCG CGCGCGGACG CGCTGCGAGT CGGGCACGGC 
GATGGCGCGT ATCGCGACGA GCGCGCGCGC GTAGTTTTTT TGGGACGACT GGTCCCCATC 
AAGGGCGTGG CGGTATTGCT CGAGGCCTGC GCCCAGTTCG CGCGCGCCGG GTTCGCGCTG 
GATCTGCTCG TGGCCGGCGA TGGGCCGCTG CGCGCCCAGC TCGCGGCGCG CGCCGAGACC 
CTGCGCGCGA GCCTGCCGCC GGGCGCGGCT GCGCTCAGCG TCGAGTTCGC GGGTGAGCTA 
CAGGGCACCC GCCTGGGCGA TGCGGTGGCC GCGGCCGACC TGCTGGTGTT GCCTTCGCTG 
CCGGTCGCCG GCGGTCGCAG CGAGGGCGCT CCGGTCACCG CGCTCGAGGC CATGGCCGCA 
GGGACGGCGG TGTTGGCCTC GCGTACTGGC GGCCTGGCCG AGCTGCCCGA AGACGCCGCG 
ACCCTGGTCC CGGCCGGCGA TGTCGACGCG CTCGCCCAGG CGCTGCGCAG GCTGCTGCGC 
GATCGCGCAG GGCGGGCGGC GCAGGTGCGG CGGGCGCGCG CGTGGGTGCG ACAACATGAC 
TGGGCAGAGG TCGGAGCAGC GCTGTGGTCC CTGTATGAAA ACCCGCGGTA A

Protein sequence

MRVGVVTSSY PRWPGDPAGN FVAAHAGWLR DAGHAVEVVC AGEPGARARW QEGVRVLPVA 
ARPGLFYAGG APEALSMSRS RPRPAMAAAA LAFSLSLRRA LAERAHYWDA VFAHWLLPSA 
AAAVLALPRS RRAVAIAHSG DVHLARALAL CTPLAAAMHA RGDRVCFVSE HVRARFLAGV 
WPRGLRRALR ARSLVRPMGV SLARWQAARA RADALRVGHG DGAYRDERAR VVFLGRLVPI 
KGVAVLLEAC AQFARAGFAL DLLVAGDGPL RAQLAARAET LRASLPPGAA ALSVEFAGEL 
QGTRLGDAVA AADLLVLPSL PVAGGRSEGA PVTALEAMAA GTAVLASRTG GLAELPEDAA 
TLVPAGDVDA LAQALRRLLR DRAGRAAQVR RARAWVRQHD WAEVGAALWS LYENPR