Gene Hoch_5554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5554
Symbol
ID	8547968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	7621548
End bp	7622921
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	72%
IMG OID	646390227
Product	hypothetical protein
Protein accession	YP_003269929
Protein GI	262198720
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.442133
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAACGCG CGATCATCGT CCTTTGCATC CTGCTCCTGG CCGGCGCGGC CACCTTTGGC 
GTGTTGGCGT ACCGCGAGGT CGAGCGCCAG GGCGAGCGTC TCGAGGCGGC CTTTGCGCAG 
CAGCGCAGCG AGGCCGCGCA AGCGCTCGCC GCGCATCGCG AGCAGTTCCT CGCCGACCAG 
GCCTGGCTCG CTGAGTCGGG ACTTTGGCCC ACGGCCTCGG CCGAGGTCCC GGCCGAACGC 
GACGCCGCCG GGTTGCTCAA CCCAGCGCTG TCGTGGACCG GGCCGCTGAG CGAGGACGAG 
GGCGCGGCCA CAAGCGCGCT GCTGACGTTG CCCGAGCCGG TGCGGCAGGC GCTCGACCAG 
CCCGCGCTGT GGCAGGAGCG CGAGCTCACC TGGCTCGAGG ACGAAGAGGC GCAGCAGATG 
ATCCGCGCGC TCGATACCGG ATGGATGGCC AAGCTGTCCG AATTCGATCG CTGGAGCCTG 
GAGCGCGAAG GGCCGATGGC GGCGGTTTTG AGCCGGCCGG ATGCCGAGCT CGACGTCACC 
GAGACCGCGC TGCCGAGCTA CATCGTCCTG CGCCACTGGG TGCAGGTGCG GGTGTATCAA 
GCGCTCCTCG CCGAGGACGC CGCCGAGGGC GAGGACGCCG CGGATGGCGA GGACACAGCG 
GATGGCGAGG ACGCGGCGGG TGACGGGGAC GCGGCGGAGG GCGAAGGCGG CGAGGAGGTC 
GCGGCCGACG ACAGCGCGGC CGAGGCCGCG GCGGCCGAGA TCCGGCAGCT CGTGCGGCTG 
ATGTTTTCGA CCGAGGAGAC GATCTCTGCG ATCTTCGCCA CCGCGCTGGT CGCCTATGTT 
CACGATATCG CCGAGAAGGC TGACCAGCCA GCGCTGCGTA TCGTCACCAG CGCTGACGAG 
CTCGCGCGTT TGCAGCGCGT GGTCCGGGCC ACGGCGATGC TGCTGCAGCC GAGCCTGGGC 
CCGGAGTACC GCGAGCTATT CGCGGCCATG CCGATCGGCC ACTGCCTGGC GCTCGGCGAC 
GCGGTGGTCG CCGGCATCGC CCAGTTCGAA CCGGTGCTGC GCCACGCCAT CCCCGAGTAC 
ATCGACCGCG TGTCCGAAGT TCTCGCGGCG CACGACGAGT GCCGGGTGCC GCTGCTGCGC 
CGGGTGTGGG ACAATGAGGA CTGGCTGCGC GCGCGCATGG GCGGCCGCGA GCTGTTCGAG 
CGCGAGGGCA TCGGTGGCGA CGAAGGCGGC GAGCTTGGCG AGGTCGAGGC CGGCGGCGAC 
GTCTTCGCCG TGGCCGAGAG CGAGTGGGTG AGCAAGCGCG TGGCCTGGAT ACTCCTGAGC 
ACGGCCGCCG TCGATCCCTG GGCCGGCTAC CGCCCCGAGC CCGCCGCGCC CTGA

Protein sequence

MKRAIIVLCI LLLAGAATFG VLAYREVERQ GERLEAAFAQ QRSEAAQALA AHREQFLADQ 
AWLAESGLWP TASAEVPAER DAAGLLNPAL SWTGPLSEDE GAATSALLTL PEPVRQALDQ 
PALWQERELT WLEDEEAQQM IRALDTGWMA KLSEFDRWSL EREGPMAAVL SRPDAELDVT 
ETALPSYIVL RHWVQVRVYQ ALLAEDAAEG EDAADGEDTA DGEDAAGDGD AAEGEGGEEV 
AADDSAAEAA AAEIRQLVRL MFSTEETISA IFATALVAYV HDIAEKADQP ALRIVTSADE 
LARLQRVVRA TAMLLQPSLG PEYRELFAAM PIGHCLALGD AVVAGIAQFE PVLRHAIPEY 
IDRVSEVLAA HDECRVPLLR RVWDNEDWLR ARMGGRELFE REGIGGDEGG ELGEVEAGGD 
VFAVAESEWV SKRVAWILLS TAAVDPWAGY RPEPAAP