Gene Hoch_0021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_0021
Symbol
ID	8542391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	24316
End bp	26331
Gene Length	2016 bp
Protein Length	671 aa
Translation table	11
GC content	75%
IMG OID	646384809
Product	hypothetical protein
Protein accession	YP_003264556
Protein GI	262193347
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACGA GTGAGGTGGA GGCGGCGCTC GAGAGCGCCC TTGCCGAGGG GACTCTCGGT 
CTCGCGCGAC GCGCGACGCA GGAATGCCGC GCGCTGCTGC GGCTAGCCGA GGCCGGCGCG 
CGCGAGGGCG ACCCGCGCTG GGATGAGGTA TTTGCCACGC GCGCGGCCTG GGGGCCGCTG 
CTCTACGGGC TGCTCGACAA AGCCGAGGGG CGCCTGCCGC CGCTCATGCA GGCGCTGCTG 
ATCTTTGCCC TGGAGCCGGT CGATACCACG ATCCTGGTCG TCCTCTGGGG CCTGGCCGGC 
TCGGCTTCGC TGCGCCAGCG CGCCCAGCGG ATCGAACGCG CCTGGGAACA GGACCGCGTG 
GACGAACTCT TCGCCGACCG CACGGACGAT GACGATGACG ATGACGGGGA CGCGGACGCG 
GACGCGGACG CGGACGCGGA CGACGACAGT GAGGTGGACG TCGGCATCGG TTCCGCTCCC 
GACGATGCGG CCGACGCCGA CGCCGAGATG GTTCTCGGTC ACTCGGCCGA ATTCATCGTC 
CGGCTGTGCT ATCCCGACCT GCGGCGGCAG CGCAAGGCGC TGGCCGCGCT GCGCCCCCAG 
GGTTCGCTGC GGCGCTTCGT TCTCGTCCGC TCGTCCGACG TCCGCAGCGC CGACCCGCGC 
AGCGAGCGCT TCGAACTCGA CCCCGACCTG GCCTCGGCGC TGCTCAACGC GTGGCGGCCG 
CCGAGCGGAC TCGAGGGCGT GGTGCGCAGC GGCGTGGGCG CGGGCCGCGC CCTGCATCCC 
AGCCAGACCG CCCAGGCCAG CGCGCTCGCG CAGGTGTTGC AGCCGCCGCA GCAGCGCGTG 
GCCCTGCTCG GCCGCCCGGG CGCCGGCAAG CGCACGCTGA TCCGGGCCGT GGCCGCGAGC 
GCCGGCATGC CGCTCATCGA GCTGACCCTG GACGCGCTCG AGCGCGCGCC CCAGAAGCGG 
CGCCACCTGC TCCGCCGTCT GCAGCGCGAC GCCCTGTTAT CGCGCGGCAT CCTGTACATC 
CAGCTCGACG GCCCGCTGCC GCCGCCGGTG CTGCGCGAGG TGTTCGCGGC GGTTCCCGGA 
CGCCTGGTCC TGGGAGTGCC GGTCGACGCC ACCGCCGCGC CCGCGCACGG TGAGGCCCTG 
CGCGCGCACT GGCCCGACAT CCACCTGCAG CCGCTGCCGT CCATCGCCGT GGCCTCGCAG 
CCGGCGCTGT GGCGCGCGTG TCTGAGCGAG CGCGGCCTGC CGGTCGACGC CGCCGGTCTC 
GACGCGCAGC TCGAGGCCCA CGTGTGCCGG CCGGGGCTGG TGCTGGGCGA TTTCGTCCAC 
GCGTGCGAAA TCGTCCGCAG CGTGTATCCG GCCGGTGAGT TCGCCAGCGC CGGCGCCGAC 
GACACCAGCG CCGGTGCGCG CCTGGCCCGC GCGCTGAGCG GCGCGCTCAG CAGCCATTTG 
CACCACGAGC TGGGCGCGCT GGCCGAGGCG CTGTGGCTGC CGGGCATGGA CCTCATGGAC 
GAAGATCAGG CGGCCTCGGC GCCCGCGCTG CCGCCGGAGT GGGCCGAGGT GGTCGACGCC 
ATCCGCGCCG GCACCACGCG GCTCTCGCCC TGGGCAGTGC CCGAGCATCG CAACTACCCG 
GCGCCGCGGG TGGCGCGCGT GGCCTCGAGC GACATGCGCG CGGTCGCCGC GGGCGCGCGG 
GCGCTGGCCA GCGCCGCGCA GATGCCCCTG TACCGCGTCG ACCTCGGCTA CTTCCTGGCC 
GCCGAGCCGG CCGCTGGCCG GGCCGCCTGC GCGCGCGTGT TCGCGGCCGC CGAGCGCGCC 
GGCGCCATGC TGTTGCTGGT GCCCGTCGAC CGCTTGGCCC TGCAGCACGC CGACAGCCTC 
CAGCTCGCCA ACGCCCTGGC CGCCCAGCTC GCGGACGCCA CCATCCCCGT GGTGCTCGCG 
GGCGCGCTGG CCGCGCTGCC CGTGGCCATC GAGAGCCGCA TCGACCACGT GCTGGGCGAC 
ATCGGCTCGG CCGCTCCGTC CGACGTCCCG GCCTGA

Protein sequence

MATSEVEAAL ESALAEGTLG LARRATQECR ALLRLAEAGA REGDPRWDEV FATRAAWGPL 
LYGLLDKAEG RLPPLMQALL IFALEPVDTT ILVVLWGLAG SASLRQRAQR IERAWEQDRV 
DELFADRTDD DDDDDGDADA DADADADDDS EVDVGIGSAP DDAADADAEM VLGHSAEFIV 
RLCYPDLRRQ RKALAALRPQ GSLRRFVLVR SSDVRSADPR SERFELDPDL ASALLNAWRP 
PSGLEGVVRS GVGAGRALHP SQTAQASALA QVLQPPQQRV ALLGRPGAGK RTLIRAVAAS 
AGMPLIELTL DALERAPQKR RHLLRRLQRD ALLSRGILYI QLDGPLPPPV LREVFAAVPG 
RLVLGVPVDA TAAPAHGEAL RAHWPDIHLQ PLPSIAVASQ PALWRACLSE RGLPVDAAGL 
DAQLEAHVCR PGLVLGDFVH ACEIVRSVYP AGEFASAGAD DTSAGARLAR ALSGALSSHL 
HHELGALAEA LWLPGMDLMD EDQAASAPAL PPEWAEVVDA IRAGTTRLSP WAVPEHRNYP 
APRVARVASS DMRAVAAGAR ALASAAQMPL YRVDLGYFLA AEPAAGRAAC ARVFAAAERA 
GAMLLLVPVD RLALQHADSL QLANALAAQL ADATIPVVLA GALAALPVAI ESRIDHVLGD 
IGSAAPSDVP A