Gene Hoch_4036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_4036
Symbol
ID	8546437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	5540106
End bp	5541884
Gene Length	1779 bp
Protein Length	592 aa
Translation table	11
GC content	75%
IMG OID	646388713
Product	glycosyl transferase group 1
Protein accession	YP_003268428
Protein GI	262197219
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.212035
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.445852
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCGCA TCCTGATGAC CGGCTTCTTC TGCCTGCCTG CGCCGGATCG CGTAGCGGTG 
CAAATGCACC ACCTGCTGCG CGCGCTGTCG CGGCATCACG AGGTGGATGT GTTGGTCGCC 
CGCGCGGACG ATCACGCCTA TGTCGAGCGC AGCGGCGGGG CCTCGATCCT GCGCGTCCCC 
ACCCGCGAGG ACAGCATCGA TGGACGCCTG GCTAGCTTCC GGCGGGCGCT GCGTCGCCAG 
CTCGGCAGCG CCGACTACGA TCTGGTGCAC TTCCGCGACG GCTGGTGCGG CTCGGTGGTG 
GTCGAGCTGC GCCAGCGCTA CGGCTACATC ACTGTGTTCG ACGCGGCGCG CGCGCCGCTC 
GCCGGGCCGC CGATCCTCGA CCTCGAGGTG AGCGCGGCGC TGGCGCGCGA CGAGGAGCTG 
TGCCTGCAGC AGGCCGACCA CGTGCTGGTG CCGACCGCGC TGGCCCGCGC CCACCTGCTG 
GAGCAGCGCG GCGCCGGCGT GCACCTGGTG CCGCCGGGCG TCGATGTCGA TCTCTTCGAC 
TGGCTGCCGG CGCGTCCCGG GCCGCCGCTG GTGCTGTACG CGGGCGCGGT CGAGGCCGGC 
CGCGGTCTGC GCGTGCTGCT GCGGGCCTTC GCCCGGCTGG CGCCGCATTC GGACGCGCGT 
CTGGTCATCG CCGGGCGACC CAGCGGCAAC GCGGCCTCGT CGCTCAACGC GGCGATCGCC 
GAGCTGGGCA TCGAGGAGCG CGTGACCCTG GAGCCGGCGG TGGCCAATGA GGACATGCCC 
GAGCTCATCG CCCGCGCGGC GGTGTGCGTG GCGCCCTCGG CGGCCGAGGT GTCGGTGCAG 
CCCATGGCCC TGTACCCGAC CAAGATCCTC GAGTACATGG CCTGTCGCCG GGCCGTGGTC 
GCGGCCCGCC GCGGCGCCGC CAGCCTGCTC ATCGAGGACG GGGTGCACGG TGTCTTGTTC 
CGCCCCGGCG ACGCCGAGGA TCTGGCCGAC AAGCTGCTGC TCGTGCTCGA GGACGCGGCG 
CTGCGCGAGC GCCTGGCCGC GGCCGGCTAC CGCCGCGTGC GCGACGAGCA CACGGCCAGC 
AACACCCGCC GCGCGGTGCG CGCCGCCTAC GCCGGCATGC AGGTCGACAC CAGCGAGTAC 
CGCACCCTGA CCCTGAGCAG CGTCGACATC ATCGCCCCGG AGCTGCCGGG CTCGCTGCCC 
GAGGGCTCGG TGCGCGTGGT CGAGCTGGCC GGCGGCAACC GGGCGACCAC CGACGAGGAG 
AGCGTGTTGC CGCGCGCGTT CGGGCCGGTG GCCAACCTCG ACACGCTCAC CGATGGCCGC 
GGGCCGCAGG CGGCGAGCGA CGCCGGCCCG ACGCGCGAGC GCCCCTCGCT GCAGACGCGC 
GATACCTACC GCATGCCGGC CTTCGAGGTG GCGGAGCTGG AGCCCGAGGG CGAGGGCGAG 
GGCGAGGACG AGGACGAGAT CCGCGCCGAT ACCGACCCGG TGGACGAGGA CAGGGACAGA 
GATAGAGACG GGGACGAGGT CGGCGCGCAC GCCGACGTGG TCGGCGCGGT CGCCGCCGCC 
ATCGCGTCGC CGACGCCGCC GCCGCCGCCG CCGCCGCCGC GAGCGCGGGC AGCGGCCCGG 
AGCCGCGACG CCCGCAGCGA GCGCGACTCG CTCAGCGCTG CGGGCGAGCT CGAGGTGCGG 
CCCGTGCGCG TGCCGCTGAG TCCCGACGAG CGCCCGACCA CGCCGAGCAT GCCGGCCATC 
CAGATCCCCG ACGACGATCT CGGCGACGAG CCCGCGTGA

Protein sequence

MSRILMTGFF CLPAPDRVAV QMHHLLRALS RHHEVDVLVA RADDHAYVER SGGASILRVP 
TREDSIDGRL ASFRRALRRQ LGSADYDLVH FRDGWCGSVV VELRQRYGYI TVFDAARAPL 
AGPPILDLEV SAALARDEEL CLQQADHVLV PTALARAHLL EQRGAGVHLV PPGVDVDLFD 
WLPARPGPPL VLYAGAVEAG RGLRVLLRAF ARLAPHSDAR LVIAGRPSGN AASSLNAAIA 
ELGIEERVTL EPAVANEDMP ELIARAAVCV APSAAEVSVQ PMALYPTKIL EYMACRRAVV 
AARRGAASLL IEDGVHGVLF RPGDAEDLAD KLLLVLEDAA LRERLAAAGY RRVRDEHTAS 
NTRRAVRAAY AGMQVDTSEY RTLTLSSVDI IAPELPGSLP EGSVRVVELA GGNRATTDEE 
SVLPRAFGPV ANLDTLTDGR GPQAASDAGP TRERPSLQTR DTYRMPAFEV AELEPEGEGE 
GEDEDEIRAD TDPVDEDRDR DRDGDEVGAH ADVVGAVAAA IASPTPPPPP PPPRARAAAR 
SRDARSERDS LSAAGELEVR PVRVPLSPDE RPTTPSMPAI QIPDDDLGDE PA