Gene Hoch_3446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3446
Symbol
ID	8545834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	4758225
End bp	4759361
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	70%
IMG OID	646388113
Product	hypothetical protein
Protein accession	YP_003267841
Protein GI	262196632
COG category
COG ID
TIGRFAM ID	[TIGR00374] conserved hypothetical protein

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.930769
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.012517
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTGG CACTCAATAT CGGTCTGTCG CTGACCATGC TGGCCATCTG CCTGTTCCTG 
GTGTGGCCGG CGCCGGCCGA GCGCGCCCAG CTCGGCGAAG CGCTCGGACG GCTGGACGAA 
ATCTACCTGC TCGGCTTCAT CGCGCTGCTG GCGGTGGTGC ACTTCTTCCG CGCCTGGCGC 
TGGAACAACC TGCTGGCCCC GCTGGGCGCC CGGCTCGGCG CCGGCCGCCT GCTGGCGGTG 
TCCTCGGTCG GCTTCATGGC GATCCTGGCG CTGCCCGCGC GCCTGGGCGA GTTCGTGCGC 
CCGGCCCTGG TGCGCGAGCA CGGCACGCTG TCGGCCACGG CCGCGCTGGG CACGGTGGCG 
GTCGAGCGCA TCATCGACGG GCTGCTGGTG TCGCTGCTGG TGTTCGCCGC GTTCTTCTCG 
CTGCGCGGAC CGGAGGCGCC GCCGTGGATG ATGCCGACCG CGTACGCGGC CCTGGGTATC 
TTCTCGGCCG CGCTGGTGTT CCTCGGCTTC GCCATGCGCT GGCCGGAGAA GACCGTGAAC 
ACCGCGGTCG CGCTCACGGG CGCGCGCCTG CTGGCGCCGC GCTTCGCCGA GGTGCTGCGC 
GAAAAACTCC TGAACATGAT CAGCGGCTTC CTGGTCATGA ACGACCGCCG CAACCTGCTG 
TGGTTTCTGC TCTGGAGCCT GGTCTACTGG ATCGCCAACG GCCTCAGCCT GTGGGTGCTC 
TCGCTCGGCT TCGATCTCGG CCTGGGCGTG GTCGGCGCCT TCGCCACCAT GGGCCTGGTC 
GCGGTCGGCA TCACCCTGCC CAACTCCCCG GGCCTGGTCG GTCAGTATCA ATGGTTCACC 
CAGCTCGGCC TGTCGCTGTA TCTCGGCCAG GCCGGCCACG GCGCCACCGG GCTGGCCTTT 
GCCATTGTTT TGCACGGGGT CCAGGTCGTC TGGTACATGC TGATGGGAGG CATCGCGCTG 
GCCACGCCCT TCGTCTCCCT GCACGAGGTG TGGCGGGCGC GGCGCATCGA CGACGCCCCA 
CAGGCCGCCA ACGACGCCCC CGACGACGAC CCCGACGAGG ACCGAGCTAA CATCGCAGAC 
GACGCAGCGG GCGCCCGCCT GTCGGCCAAC GCCGCCAACC CGAGCGCGCC GCCCTGA

Protein sequence

MKLALNIGLS LTMLAICLFL VWPAPAERAQ LGEALGRLDE IYLLGFIALL AVVHFFRAWR 
WNNLLAPLGA RLGAGRLLAV SSVGFMAILA LPARLGEFVR PALVREHGTL SATAALGTVA 
VERIIDGLLV SLLVFAAFFS LRGPEAPPWM MPTAYAALGI FSAALVFLGF AMRWPEKTVN 
TAVALTGARL LAPRFAEVLR EKLLNMISGF LVMNDRRNLL WFLLWSLVYW IANGLSLWVL 
SLGFDLGLGV VGAFATMGLV AVGITLPNSP GLVGQYQWFT QLGLSLYLGQ AGHGATGLAF 
AIVLHGVQVV WYMLMGGIAL ATPFVSLHEV WRARRIDDAP QAANDAPDDD PDEDRANIAD 
DAAGARLSAN AANPSAPP