Gene Hoch_3304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3304
Symbol
ID	8545692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	4557408
End bp	4558709
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	71%
IMG OID	646387971
Product	Tetratricopeptide repeat protein
Protein accession	YP_003267699
Protein GI	262196490
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.253328
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.400775
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCGCG TATGCCTCGC CCTGTCTCTC GCGCTGTGCA CGCTGGCCGC GTGCGCGGGA 
CCTCGTCAGC CGGCCGCCGC GCCCGGAGCC GCGGGCCCTG CGCAGGCGGG GGCGGGCCCG 
GTGGACAGCG CCGACGCGGG CGCCGACGCG GGCGACGACA CGCTTGCTGC GGCGGGGCAG 
GGCGAGGGCC AGGAGAACCA TAACGCTGCC GCTGTCCCCG TGTACGACCT CGAGGGCATG 
CGCATCGAGG TCGCCGGGCG CACGGCCGAG GGCGAGCCCG AGCTGGTGTC CTACGACGCG 
CAGTCGCTGC TCGACGAGGG CAACCAGGCC CTGGCCGACG AGCGCTTCGA CGCCGCCGCG 
GCCCGCTACG AGCAGCTCCT GCGCATGTTC CCCGACTCGC GCCTGGTGCC CGACGCGCTC 
TACAACCTGG GCCTGAGCTA CGAGCTGCGC GACCAGCCCG AGCGCGCCCT GGCCATGTAT 
CGCCAGGTCG GCGATCTCGC GGCCGAGCTG CGCAGCGCCG CGGTGCTGGC CGAATACGCG 
CGCTGGTCCG AGGCCCGGCG GGTGCTCGAG CGCGCGGCCG AGCGCGAGCA GCTCACCGCG 
GCCGAGCGCA TCGAGGTGTT CGCGCGTCTG GGCTACGTGG CCCTATCGCA AGAGGACGAC 
GCCGCCGCCG AGCTGGCCCT GGGCGAGGCG CTGGCGGACT TCGATGCGCT CACCGCGGCG 
CCGGCCGATC TGTATTACCC GGCGATGGCG CGCTACTACC TGGCGCAGAT TCCCCACCGG 
CAATTGCAAC GACTGACGCT GCGCCTGCCC GACGCGCAGC TTCAGCGCGA CCTGGAGAAT 
AAATCCGAGC TGCTGGCGCT GGCCTACGAT CGCTATCGCG CCACGCTCGA CATCCATCAT 
CTCTATTGGG CGACCGCGGC CGGATATCAA ATGTCGCAGA TTTATAAAGA GTTCTGGGAC 
GACGTCATCG CCGTGCCGGT GCCGCCGCAG CTCGCGCCCG AGGCCGCGCA ATTCTATCGC 
CGCGAGGTCC ATGAGCGGGT GCGGCCCATG CTGGAGAAGG CCCTCGACGG CCACCTGCGC 
AACCTCGATC TCGCCGACGC CTACGGCCAG GCCACCGAGT GGAGCCGGGC CTCGCGGGTG 
CGCGCCGATG AGATCGCGAG GCTGCTCATG CGCGAGCACG CCGGCGAGCT GGTGAGCCCG 
CCCGGGGTGA CGCCGAATTC GCCTCGCGCT GCCGACGATG CGCAGGAGCC GGATTCACGC 
TTTGCGCCCG AGCGCTATGT CCCCGATAGA TTCACGCTCT GA

Protein sequence

MSRVCLALSL ALCTLAACAG PRQPAAAPGA AGPAQAGAGP VDSADAGADA GDDTLAAAGQ 
GEGQENHNAA AVPVYDLEGM RIEVAGRTAE GEPELVSYDA QSLLDEGNQA LADERFDAAA 
ARYEQLLRMF PDSRLVPDAL YNLGLSYELR DQPERALAMY RQVGDLAAEL RSAAVLAEYA 
RWSEARRVLE RAAEREQLTA AERIEVFARL GYVALSQEDD AAAELALGEA LADFDALTAA 
PADLYYPAMA RYYLAQIPHR QLQRLTLRLP DAQLQRDLEN KSELLALAYD RYRATLDIHH 
LYWATAAGYQ MSQIYKEFWD DVIAVPVPPQ LAPEAAQFYR REVHERVRPM LEKALDGHLR 
NLDLADAYGQ ATEWSRASRV RADEIARLLM REHAGELVSP PGVTPNSPRA ADDAQEPDSR 
FAPERYVPDR FTL