Gene Hoch_3839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3839
Symbol
ID	8546232
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	5288174
End bp	5289697
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	66%
IMG OID	646388508
Product	polysaccharide biosynthesis protein
Protein accession	YP_003268231
Protein GI	262197022
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.133481
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCCAGCA CAGGCGTCCG CGAGTGTATA AACAGCCCGC GACTCTCCCT GGTAACTGGC 
TCATCTATGT CCTTAGCGCG AAAAGCTGTA CATGGCGCCA TGTGGACGGT CGGTGCGAGC 
CTCGGAGCTC GCGCCATCGG CCTCGTCGGC ACGGTGGTGA TCACGTATTT CCTCTCGCCC 
ACCGTGGTCG CCGAGGTCAA CGCCGCCGCC ATTCTCGCCA TGTCGGCCAG TTTGCTCAGC 
AATTTCGGCA TCGGCAACTA CTACATCGTC AAAGGTGATG ACCGCGAGGT CGCCTTCCAC 
ATGACGGTGT ACAACCTTTT GCTCGGAGCC GTGGTTTTCG GCCTGGTATT GGCCTTTAAC 
GAACCTCTGA GCGAGCTGCT GAATCTGCCC GCGATATCGG AGTTTGTCCC CGGTATGGTG 
CTGGCCTGGT CCATCCGCCG CGTGGCCATG CAATCGCAAA AGGTGCTGGT GCGCGACATG 
CGCTTCGGCC GCCTGAGCAT CGCGCGCGCG CTGGGTGAGA TTTCCTTCGT GCTCACCTCG 
GTGGGTCTGG CCGCGCTCGA GTACGGCGGC ATGGCCATCG TCATCGGCAA CATCGTCCAG 
TACTCGGTCG ACGGCGTCAT CACCATCACC TCGGTGCACT GGCGGACCTG GCTCGAGCCC 
TGCAAATTGC GCTGGGAGCG CACTGTCGAC ATGTTCCGCT TCGGCTGGCC GCTGGGCGTC 
AACGCCTTCG TCGGCTACGC CACGCATAGC TGGGACCGGC TGCTGTTCGC CAACCTGTTC 
AACACCCACC TCATGGGTCT GTACAACTAT GCCTACCGCC TGGCCGAAAT ACCGGCCTCG 
CAGGTGGGTG ACCAGATCAG CGACGTGCTG CTGCCGTCGA TGTCCAAGCT CGACGCCGAG 
GGCCGCAAGC GCGCGCTCAT CCGCTCCACC GCCCTGCTGG GCGTGCTGCT GTTTCCGCTC 
ACGGTCGGGC TGGCGGCCGT GGCCGAGCCG CTGATCACGC TGATCTTCGA CGAGGCCTGG 
CACAGCACCG CGCCCATGGT GTCGGTGCTG GGCGCCTGCT TCGTGTTCGA GCCCATCGGC 
AGCACCCTGG TCTCGTATCT GATGGCCCAG AGCCGCACGC GCACGCTCAT GATTCTGCAG 
ATCATCAAGC TCGGCGCGCT GTTCGCCGGC ATGACCCTGC TGTCGACGCT GGGCCCGCTG 
TGGGCGTGCG GCGGCGTCGG CGTCGGCTTC GCGGTCTACG GCTTGGTCAG CGCGTATCTG 
TGCGTGCGCC GCGACAACAT CCCGGCCGGC AAGCTGCTGT CGGCCTTTGT CCAGCCGCTC 
ACGGCCTGCG TGCCCATGGT CGGCGCGGTC CTGGGCGTGC GCTACGGGCT GCGCGCGGCC 
GGCTTCGACA GCCCGGCGCT GTCGCTGGGA TGCGAGATCG TCGCGGGCGC CGCCGTGTAT 
GTGCCCGCTG TGTTCCTGAC CGCGCCGGCG ACGGCGCGCG ACTTCCTCAG CCTGGTGCGC 
AAGGCGCTCA AGCGCGGCGG CTGA

Protein sequence

MPSTGVRECI NSPRLSLVTG SSMSLARKAV HGAMWTVGAS LGARAIGLVG TVVITYFLSP 
TVVAEVNAAA ILAMSASLLS NFGIGNYYIV KGDDREVAFH MTVYNLLLGA VVFGLVLAFN 
EPLSELLNLP AISEFVPGMV LAWSIRRVAM QSQKVLVRDM RFGRLSIARA LGEISFVLTS 
VGLAALEYGG MAIVIGNIVQ YSVDGVITIT SVHWRTWLEP CKLRWERTVD MFRFGWPLGV 
NAFVGYATHS WDRLLFANLF NTHLMGLYNY AYRLAEIPAS QVGDQISDVL LPSMSKLDAE 
GRKRALIRST ALLGVLLFPL TVGLAAVAEP LITLIFDEAW HSTAPMVSVL GACFVFEPIG 
STLVSYLMAQ SRTRTLMILQ IIKLGALFAG MTLLSTLGPL WACGGVGVGF AVYGLVSAYL 
CVRRDNIPAG KLLSAFVQPL TACVPMVGAV LGVRYGLRAA GFDSPALSLG CEIVAGAAVY 
VPAVFLTAPA TARDFLSLVR KALKRGG