Gene Hoch_2053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2053
Symbol
ID	8544435
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	2839440
End bp	2840780
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	73%
IMG OID	646386756
Product	hypothetical protein
Protein accession	YP_003266491
Protein GI	262195282
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.567279
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.709257
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCGCA TCCAACATCG TCCCCCGCTC GCCCCGCCGG GATACCGCGC CGCGGCGCCC 
CGCGGCCGGG GTCGCGGCCC CCACACGCGT GGGCTGGCCC TCGCCTCGCT GGCCCTCGCC 
TCGCTGGCGC TCGGCGGCCT GCTGCTCGCC TGCGGCGGCG AGGGCGACAG CGCCCCCGAC 
GCCGGCAGCG CGGACGCGAG CATCTCGGAC GCCCGTCCCA GCGACGCCGG CGACGCGGAC 
GGCGGCGGCA ACGCGCTGTG CACGAGCGGC GCGCTCACCA GCACCACCTG GCGCGACTAC 
GGCTCCCTGG CCACGCATGC CGCGTCCATG CTGGTGTTCG ACGATCAGCT CTGGGTGGGC 
ACGGACGACG GCCTGTGGTC ACACCCGCTC ACCGACGACG ACGGCGGCGA CGGCGACCTG 
TGGCAGCAGC GCGCGCTGGC GGGCCGTCGC GTGAGCGCCC TGCGCGTGCT CGACGCCGAG 
GCCGGCACCC TGCTGGCCGG ACTCGCGTCC GCCGAGGCCG CAGCGCAGAC CGAGCCCGCC 
TTCGCGCTGT CGAGCGACCG CGGCCAGAGC TTTGCCCTCT ACGGCGCCGA GCTCGGCTAC 
GACGACGCCG GCACGCGCCG CTACGACGCG GTCAACGACC TGGCCGTGCA CCGCAGCGGC 
GCCATCTACG CGGCCATGTC CGGGGTGTCG ATCGCGCGCT CGAGCGACGG CGGCCAGAGC 
TGGAGCTACG TGTTCGGCCA GCCCGCCCAG ATCTGCTATC CGTGCCGCCT GCACATCGCC 
GCAGGCGCGC CCGACGCCCT GTACCAGGGC TGCGAGTGCC CGCTCGACAT GGCCTCGATC 
GACCGCTTCG CGCTGCCCGA GAGCGCCGAC GGCGGGTTCC CCGACCAGGG CGAGCGCCTG 
CTCGACTACC GGGACATCGG CAACCGCCGC ATCAACTCCT TCGCCAGCAC CGACGCGTAT 
CCCGGGCGGG TCTACGCCGG CGTGGAAGGC GCGCTGCTGT GGCTCGAGGG CGCGGACGAG 
TGGGACTACC TGTATCGCTC GATGGGCGCC GAGAAGCTGT ACACCTACGT CGAGGCCATC 
TGGATCGACC CCTGCGACCC GGCGCATATC GTCTTCGGCG GCGGCGAGCA GAGCGAAAAC 
CAGATGCTGA GCCTGTTCGA GAGCTACGAC GAGGGCGTGA GCTGGGAGAT GCTGATGCCG 
CCGGGGCTGA GCTTCGATCA GGCCGTGGTC GAGCGCGGCC TCAGCGCGGG CGCGAGCGGC 
GAGCACGCGA TCCTGGCCGT GTGGACGAAT TCCGACGGCG CCAAGAGCGT GCGCATCCTC 
GCCAAGCGGC ATTCGCCCTG A

Protein sequence

MDRIQHRPPL APPGYRAAAP RGRGRGPHTR GLALASLALA SLALGGLLLA CGGEGDSAPD 
AGSADASISD ARPSDAGDAD GGGNALCTSG ALTSTTWRDY GSLATHAASM LVFDDQLWVG 
TDDGLWSHPL TDDDGGDGDL WQQRALAGRR VSALRVLDAE AGTLLAGLAS AEAAAQTEPA 
FALSSDRGQS FALYGAELGY DDAGTRRYDA VNDLAVHRSG AIYAAMSGVS IARSSDGGQS 
WSYVFGQPAQ ICYPCRLHIA AGAPDALYQG CECPLDMASI DRFALPESAD GGFPDQGERL 
LDYRDIGNRR INSFASTDAY PGRVYAGVEG ALLWLEGADE WDYLYRSMGA EKLYTYVEAI 
WIDPCDPAHI VFGGGEQSEN QMLSLFESYD EGVSWEMLMP PGLSFDQAVV ERGLSAGASG 
EHAILAVWTN SDGAKSVRIL AKRHSP