Gene Hoch_4981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_4981
Symbol
ID	8547389
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	6867384
End bp	6868538
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	71%
IMG OID	646389655
Product	Tetratricopeptide TPR_2 repeat protein
Protein accession	YP_003269363
Protein GI	262198154
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.389941
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTTTGG TGGCGTGTGG TGGTGATTCG AAAGGCGCCG AGCAGCCCGA GCAGCCCGAC 
CCCGCGGCTC AGGCGGAAGA GGCCTTGTCC CAGGCCGATG AGGCCCGCGA CAGCGGACAG 
GCCGCCGCCG CGGAAGGCCA CTACGAGCGC GCCCGCGAGC TGCGCCCCGA GCACTACGAG 
ACCGCCGAGC GCTACGTCGG CTTCCTCATC GCCGAGGGCC GCGCCGATGA CGCGGTCGCC 
GAGGCGCAGG AGTACCTCGA GCAGGCCATC GGCGAGCTCA AGGGATACCA CCTGCTCGCC 
GAAGCGCAGA TGGCGGCCAA GGACTACGAG GGCGCGCGCA GCACCCTGTC GCAGCTCCTC 
GGGCTCGACG AGACCGACGC CGCGGCCTAC GCCAAGCGCG GCGAGGCCGC GATCGCCCAG 
AAGGACTACG AGTCCGGCCT CGAGGACATC CGCAAGGCCA TGGAGCTCGA GCCGCAGAAC 
CTCGAGTACC GGGTGACCCT GGGCAAGGGG CTGCAGGAGA CCGGGCAGAA CGGCGAAGCC 
GCCGAGGTGC TCGCGGCCGT GGTCGAGGAG AACCCGGCGT ATCTCGACGG CCTGCTGGTC 
TACGGCGCGC TGCAGCGCTC TGCCGGCAAG CTCCAGGACG CGCGCGAGCT GCACCAACGG 
GCCGTGGAGA CCAGCCCCGA GTCGGCGCTG GCGCACTACG AGCTGGGTAT CACGCAGTTC 
TACATGGGCG ACCGCGACGA CGCGCTCAGC AGCCTGCAGC AGGCCACCGA GCTCGACGCC 
AGCGACGCGC AGATCCGCTA CGTGCACGGC GAGCTGCTGC GCAACATGGG GCGCTTCGAA 
GAGGCGGCCG AGCGCTATCG CGATGCGCTC GACCGGCAGA AGGATCACGA CAAGGCCGCC 
GCCAAGCTGG GCCTCATGCT GACCAAGCTC GAGCGCTTCG ACGAGGCCGC CGAGGTGCTG 
AGCGCCCGCG TCGAGCGCGA GCCCCAGGAC GCCGACGCGC TGCTCTACCT GGGCCAGCTC 
CACGAGTCGC AGGAGCAGTT CGCCGAGGCG GTCGCCGCTT ACGAGCGCTT CCTCGAAGTC 
GCCGGGCCCG ATGAGCAGGC CAGCGTCCCC GAGGTCAAGC GCAAGGTCCG CATCCTCAAG 
CGCAAGGTGC GCTGA

Protein sequence

MGLVACGGDS KGAEQPEQPD PAAQAEEALS QADEARDSGQ AAAAEGHYER ARELRPEHYE 
TAERYVGFLI AEGRADDAVA EAQEYLEQAI GELKGYHLLA EAQMAAKDYE GARSTLSQLL 
GLDETDAAAY AKRGEAAIAQ KDYESGLEDI RKAMELEPQN LEYRVTLGKG LQETGQNGEA 
AEVLAAVVEE NPAYLDGLLV YGALQRSAGK LQDARELHQR AVETSPESAL AHYELGITQF 
YMGDRDDALS SLQQATELDA SDAQIRYVHG ELLRNMGRFE EAAERYRDAL DRQKDHDKAA 
AKLGLMLTKL ERFDEAAEVL SARVEREPQD ADALLYLGQL HESQEQFAEA VAAYERFLEV 
AGPDEQASVP EVKRKVRILK RKVR