Gene Hoch_3158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3158
Symbol
ID	8545546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	4344992
End bp	4346185
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	70%
IMG OID	646387825
Product	protein of unknown function DUF819
Protein accession	YP_003267553
Protein GI	262196344
COG category	[S] Function unknown
COG ID	[COG5505] Predicted integral membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.548354
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.649523
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATTCAAG AACCTACTGC CATCGTCGCC GTATTGCTGG CTGTCCTGGC GGTGCTGTTC 
CTGGCCGCCC GCTGGCCGGT GACCGAGCGC CTGTTCCGGA TCGTCCCGCT CCTGCTCTTC 
GCCTACTTCG TCCCGACCCT GCTGTCGACC TTCGACGTCA TCCCCAGCGA GGCGCCGGTG 
TACGGGTGGA TCAAGAACTG GCTGCTGCCG GCCAGCTTGA TCCTCATGAC CCTGTCGGCC 
GACATCCCGT CGATCCTGCG CCTGGGTCGC AACGTGCTGG TGCTGTTTGT GTCGGCCACA 
GCGAGCATCG TCATCGGCGG GCCGCTGGCC TACCTGGCGC TCGGCTGGGT GGTTCCGCCC 
GAGCTCGGCG ACCAGGCCTG GCGCGGACTG GCCGCGCTGG CCGGCTCGTG GATCGGCGGC 
GGCGCCAACT TCCTGGCCAT CGGCGAGAGC GTCGGCGCCG GCAACGAGAT CATCGGCATC 
ATGATCGTCG TCGATGTCGC CGTGGCCAAC GTGTGGATGG CCGCGCTGCT GTTCTTCGCC 
GGCCGCAGCC GCAGCATGGA CCAGGCCATC GGCGCCGATC GCGACAGCCT CGAGGCCCTG 
CGCACCCGGG TGCAGGCCTA TCACGACTCC ACCGCGCGCC CGACCACCAC CGCCGACCTC 
ATGGCCATCG CCGCGCTGGC CTTCGGCGGC ACCGCCTTGG CCCACCTGGC CGCGCCGCAT 
CTGCCCGAGA CCTCGATCAC CAGCCAGTTC GTGTGGGTGG TGCTGGTCGC CACCACCATC 
GGCACCGTGC TGTCGTTCTC GCCGGTGCGC AAACTCGACG GCGGCGGCGC CAGCGCAGTC 
GGCTCGGTGT TCATCTATCT GCTCGTGACC TCTATCGGCG CCACCGCGGA CTTCAGCCGG 
GTGCTCGACT ACGGCGGCCT GGTCGTGGTC GGCGCGCTGT GGATGCTGTT CCACGCCGTC 
ATCATGCTGG TGGTGCGCCG GCTGCTGCGC GCGCCCATCT TCTTCGCCGC CGTGGGCTCG 
CAGGCCAACG TCGGCGGCGC CGCCTCGGCC CCGGTCGTGG CCGCCGCCTT CCACCCCTCG 
CTGGCGCCCG TGGGCGTGCT GCTGGCGGTC GGCGGCTACG TGCTGGGCAC GTATATGGCG 
CTCGCCTGCG CCTTCCTGCT CGAGCTGGTC TACAGCATGT ACTTCGCGCT CTGA

Protein sequence

MIQEPTAIVA VLLAVLAVLF LAARWPVTER LFRIVPLLLF AYFVPTLLST FDVIPSEAPV 
YGWIKNWLLP ASLILMTLSA DIPSILRLGR NVLVLFVSAT ASIVIGGPLA YLALGWVVPP 
ELGDQAWRGL AALAGSWIGG GANFLAIGES VGAGNEIIGI MIVVDVAVAN VWMAALLFFA 
GRSRSMDQAI GADRDSLEAL RTRVQAYHDS TARPTTTADL MAIAALAFGG TALAHLAAPH 
LPETSITSQF VWVVLVATTI GTVLSFSPVR KLDGGGASAV GSVFIYLLVT SIGATADFSR 
VLDYGGLVVV GALWMLFHAV IMLVVRRLLR APIFFAAVGS QANVGGAASA PVVAAAFHPS 
LAPVGVLLAV GGYVLGTYMA LACAFLLELV YSMYFAL