Gene Hoch_0006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_0006
Symbol
ID	8542376
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	8473
End bp	9663
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	66%
IMG OID	646384794
Product	hypothetical protein
Protein accession	YP_003264541
Protein GI	262193332
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGCTC AGTATCAAGA CCTAGAGCAG CAGAACCACG AGCTGCGCGA AGAGAATCAG 
GCGCTCCGCG CCGAGCTCGA GCGCATCGAA GCGCGCGCGG CCAAAGCCGC CGAAGCGCGC 
ACGCGCCTCA TGCGCGGCTC GTGGCGAATC CTGGTTCCGC TCATCGATCG CCAGCGCGTG 
GCGCGCTCGT TTGGCAAGCT GGCGCAGACC GCGTCCGAGT TCGCCAACCC GCCCGCGCAT 
TGGCCGACGA AGGAGCAGAT CCTCGCCGAG GCCCGCGACT TCATGGAGTC GTGCGTGCGC 
TTCACCATCC GCAGGCGCAC GCTGCTATTG GTGTTCTCGC TCCTCGCCGC CGCCATTCCG 
GCGTTTCAGA TGTATCTGGT GGTGCAGCAA AACGAGATGA TCGAGAATCA AAACGAGTTC 
TTCGGCATTC AGGTATACGA CATCGTCTCG CGCACCATGA CCGAGGGCGA CCGCAACGCG 
CGCCAGATGA CGGGCGCTCT GCTGGCCAAC GCCAAAGTCG AGTTTCTCAG CGGCGTGGTC 
GAAGAAGCCT TTGGCGCCGG CGGACTCGGC TTTCAGTGGG GCGCGTATCG CCGCGACGAT 
ATCGACGCGC AGCAGCGGCG GCTCGAGGAC GCGGCCTTTC GCGGTCACTT GATCCGCTCG 
GTGGTGCGCG CGGTGCAGCA TCGCGGTGAC GGCGGAAAGC ATGAGATGGA TGCCGATGAG 
CTGCACGCGG CCATCGTGCC CAGCATCCGC CAGATCCTGC GCGACACCGC CGACCGCATG 
CCGCAGGTGC TGCGTCTCGG ACGCCAGGAC GGAGACATCG ATCCGGCCTT GCTCGAACAG 
GTGGACTATT ACCTGATCCA GGTCGGCGAG CTGCTGCGCG TCTACGGTCG CATCGCGCGC 
TCGGCCGATG AAGAGGCCGC GTTCTTCGAC GATATCCGGC CGCTGTTCCA GCGCATCGGC 
GGCCGCCGCG ACCTCGAGGA GAGTCGCTTT GCCGAGGTCT ACCGGCCGGT GCTGCAGGAC 
TTCCTGTTCG AGCTGGCGCT GCAACCGAAG CTCGATTCGC CGCCCGTGAA CCTCGAGACC 
GCCGGCACCT CGCCCGACGA GGCGCTCAAT ACCGGCATCG AGCGCCTGCG CAAAGGACTC 
GGCGAGCAGG CCCTCAACTG GAACCTCTTC AAACGACAGG TGGCGCAATG A

Protein sequence

MSAQYQDLEQ QNHELREENQ ALRAELERIE ARAAKAAEAR TRLMRGSWRI LVPLIDRQRV 
ARSFGKLAQT ASEFANPPAH WPTKEQILAE ARDFMESCVR FTIRRRTLLL VFSLLAAAIP 
AFQMYLVVQQ NEMIENQNEF FGIQVYDIVS RTMTEGDRNA RQMTGALLAN AKVEFLSGVV 
EEAFGAGGLG FQWGAYRRDD IDAQQRRLED AAFRGHLIRS VVRAVQHRGD GGKHEMDADE 
LHAAIVPSIR QILRDTADRM PQVLRLGRQD GDIDPALLEQ VDYYLIQVGE LLRVYGRIAR 
SADEEAAFFD DIRPLFQRIG GRRDLEESRF AEVYRPVLQD FLFELALQPK LDSPPVNLET 
AGTSPDEALN TGIERLRKGL GEQALNWNLF KRQVAQ