Gene Hoch_3788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3788
Symbol
ID	8546181
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	5206768
End bp	5207850
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	74%
IMG OID	646388458
Product	Tetratricopeptide TPR_2 repeat protein
Protein accession	YP_003268181
Protein GI	262196972
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.10732
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.21805
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTTA CCAACACCTT TCGCACTGGC GGCCGCAGCC GCCCCCGTGG CGCCGCGTGT 
GCGCGCCTGC TCTGGGCGGC CGCGGCCGCC CTCTTCATCG CCCTGTGGGC GGCGCCGGCC 
TCGGCGCAGC AGGCCGCGGC CGAGGCGCTC TTCAATCAGG GCCGGGCGCT GATGCAGGAG 
CGCAACTACG CGGAGGCCTG TGAGAAGTTC GCGGCCAGCC ACGAGCTCGA CCCCAGCGTC 
GGCGCCTTGC TCAACCTCGG CGATTGCCGC GAGAAGAACG GCCAGACCGC CACCGCCTGG 
GCCACCTATC GCGAGGCCGT GTCGCTGTCG CGGCGCACCG GCGACCGTCG CCGCGAGCGC 
TTTGCGCAGT CGCGGGCCGC GGCGCTCGAG GGCAAGCTCT CGTATCTGGT CATCGAGGTG 
AGCGACGAGG CGCGGGTTCC CGGGCTCACG CTCACGCGCA GCGGCGAGCC CGTGCTCGAG 
GCTGTGTGGG ACCAGCGTGT GCCCACCGAT CCCGGCTCCT ACGTCATCCG CGCCGAGGCC 
CCCGGGTATC GCCCGGCCGA GGTCGAGGCC GAGGTCGGCG AGGGCGGCGG CGAGGCCCGG 
GTAACGATCC CCGAGCTCGA GAAAGCGGCC GCGGGCGAGG TCACCGGGCC TTCGGCCGCG 
GACGCGCCGG TGCGGGCTGC CGGTGACGGC GAGGTCGGCG TCAGCGCGAG CGGCGGCTCG 
GAAGGCGGCA TGCCGACCGG CCGCAAGATC GCCATCGGCG TGGGCGCTGC GGGCGTGGTC 
GCGTTGGCCG CGGGCGCGGT CTTTGGGCTC AACGCCAGCT CCAAGTGGGA CAAGGCCAAG 
AGCCACTGCG TGGACGGCGA CTTCAGCAAC TGCGACGACC AGGGCGTGCA GCTCAGCAAG 
GACGCGACGG TCCAGGCCAA CCTGTCCACG GTCTCGCTCA GCGTGGGCGT GTTGGCCGCG 
GCCGGCGCCG CGGTGCTGTG GTTCACCAGC GCCCCCGACG ACACCGGCGC CGAGCGCAGC 
GCCCGGTTCA CCCCGCTGCT CACCCCCGAC ACCGTCGGGG CCAGTCTCCT CCTCCACTTC 
TAA

Protein sequence

MTVTNTFRTG GRSRPRGAAC ARLLWAAAAA LFIALWAAPA SAQQAAAEAL FNQGRALMQE 
RNYAEACEKF AASHELDPSV GALLNLGDCR EKNGQTATAW ATYREAVSLS RRTGDRRRER 
FAQSRAAALE GKLSYLVIEV SDEARVPGLT LTRSGEPVLE AVWDQRVPTD PGSYVIRAEA 
PGYRPAEVEA EVGEGGGEAR VTIPELEKAA AGEVTGPSAA DAPVRAAGDG EVGVSASGGS 
EGGMPTGRKI AIGVGAAGVV ALAAGAVFGL NASSKWDKAK SHCVDGDFSN CDDQGVQLSK 
DATVQANLST VSLSVGVLAA AGAAVLWFTS APDDTGAERS ARFTPLLTPD TVGASLLLHF