Gene Hoch_0339 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_0339
Symbol
ID	8542719
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	477222
End bp	478292
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	65%
IMG OID	646385136
Product	hypothetical protein
Protein accession	YP_003264873
Protein GI	262193664
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.110925
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCACT CGCAGCAGGC GCGCGCGTCG CGCAAGAAAC AGATTCTCTT CGTCGGTGGC 
GACGTGGCGC AGACCCGCCA GATCCACGAC GTGGCCAAGC ATCTGGGCGA CTACGAGCAG 
TATTTCTCGC CGCACTGGGG CGACCGCTTC ATCTCCCTGG TGCGCGAGCT CGGCCTCATC 
GAGTACACCA TCGCGGGCAA CAAGCGCGGT CAGAACACGC TCGATTACCT GCACGAGCAG 
GGCCTGCGCG TGGACAAGTA CGGACGCCGC GGCTGCTACG ACCTGGTGGT GTCGTGCAGC 
GATATCCTGG TTCCGCGCAA TATCCGCTAC ACCAAGCTGG TGGTGGTGCA GGAGGGTATC 
TTCGACCCCG AGCACCGCTC GTATCGCCTG ATCCGTCTGC TGCCGTTTCT GCCGCGGTGG 
ATGGCGGGTA CGGCCATGAC CGGCATGAGC GGCCTGTACG ACGCGATCTG CGTGGCCAGC 
CCGGGTTTTC GCGCGCACAT GATCGCGCGC GGCGCCGACC CCAACCGCGT GCACATCACC 
GGCCTGATCC ACTACGACAA CTGCCGGCTC TACGAAGATA ACGAATTCCC CCATCGCGGC 
TACGTGCTCG CCTGCACCTC GGACGGGCGC GAGACCTGGA AGGCCGACGA CCGCGAGGCC 
TTTATCGCCC GGGCGCTGGA GCTGGCCCAG GGCCGCCAGG TGATCTTCAA GCTGCATCCC 
AACGAGGACT ACGAGCGCTC AGAGGCCGAG ATTCGCGCGC AATCGGCCGA TGCGCTGATC 
TATTACCGCG AGCCCGGCAT CAAAGCCGAG GAGATGGTCG CCAACTGCGA GGTGCTTTTG 
ACCGAGTGGT CGACATTGGT GTTCGTCGGC CTGGCGCTCG GCAAGGAGTG CTACTCGTAT 
CACGATATGG AGCTGCTCAA GCAGCTCATG CCGATTCAAA ACGGCGGCAG CTCGGCCGAG 
AAGGTCGCCG AGATCTGCCG CCGCATCATC GAATCGCCCG AGCCGCCGAC GCCCGTGGTC 
ATGGACCCCA AGCGCTCGCT GGCCACGCGC ATCGCCGAGG CGTTTCACTA G

Protein sequence

MNHSQQARAS RKKQILFVGG DVAQTRQIHD VAKHLGDYEQ YFSPHWGDRF ISLVRELGLI 
EYTIAGNKRG QNTLDYLHEQ GLRVDKYGRR GCYDLVVSCS DILVPRNIRY TKLVVVQEGI 
FDPEHRSYRL IRLLPFLPRW MAGTAMTGMS GLYDAICVAS PGFRAHMIAR GADPNRVHIT 
GLIHYDNCRL YEDNEFPHRG YVLACTSDGR ETWKADDREA FIARALELAQ GRQVIFKLHP 
NEDYERSEAE IRAQSADALI YYREPGIKAE EMVANCEVLL TEWSTLVFVG LALGKECYSY 
HDMELLKQLM PIQNGGSSAE KVAEICRRII ESPEPPTPVV MDPKRSLATR IAEAFH