Gene Hoch_2435 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2435
Symbol
ID	8544821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	3363566
End bp	3365134
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	70%
IMG OID	646387134
Product	Thrombospondin type 3 repeat protein
Protein accession	YP_003266865
Protein GI	262195656
COG category
COG ID
TIGRFAM ID	[TIGR03382] Myxococcales GC_trans_RRR domain

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.492834
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCATC GTTCATACCG AGCTTCTCGT GATTCGTCTC TGACCTGCGG CCGCGCGTCC 
CTGCGGCCGC GCGCGGTCTT CTTGGCGGCG CTCGCGCTGG CCCTGGTGGC CGGCGCCGGC 
CTGGCTGGCG AGGCCCGCGC GCAGGTACCC ATCGAGTGTC CGGCGCCCGT GGATTGCGAC 
GCGATCGGCG TCTGCGAGCT CGCCGACCTC AACTGCAACG GCATCCTGCG CTGTGATGAT 
CCCGCCTCCG GCACCGTGGG CGAGGGCGAG TGCGTCGACG TGTGCGCGCA GGGGATCTGC 
TCCACCGAGG TCCCCGATCG GCGCGCATGC GACGACTACT TCGACCCCGA GGGCGACGGC 
GGCCAGTGCA CCACGGATCT GAACAACGCC GGTGTGGCCG ACAGCGACGG TGACTGCATC 
GGCGACGCCT GCGACAACTG CATCGACATC AGCAACCTCG CCCAGCTCAA CCGCGATAAC 
GACCTCTTCG GCAACGCCTG CGATAACTGC ATCGAAGTGC GCAACAACGA CCAGGCCAAC 
GCCGACGAGG ATCTCTTCGG CGACGTCTGC GACAACTGCG TCGACGTCGC CAACGACGAC 
CAGGCCAACA CCGATGTGGC CGCGGACGCG CCCGGCGACA GCTTTGGCGA CGCCTGCGAC 
AACTGCGTCA ACGTCGCCAA TGAGGACCAG GCCAACGCCG ACAGCGACAA CTTCGGCGAC 
GTCTGCGACA ACTGCGTCAA CGTCGCCAAC GATCAGGCCA ACGCCGACAG CGACAGCTTC 
GGCGACGCCT GCGACAACTG CGCCGGTGTC GCCAACGAGG ACCAGCGCAA CTCCGACGCC 
GAGATGGACC CGCCGGGCGA TGGCTTCGGC GACGTCTGCG ACAACTGCTT GATGGTCGCC 
AACCCCGACC AGGCCGACAG CGACGGCGAC GGCCTGGGCG ATGCCTGCGA CCTGTGCCCC 
GACGACGACA GCGACGTCGA CGACCAGGTC GACCAAGACG GCGACGGCCT CGGCGACCGC 
TGCGACGTGT GCCCGAACGT GGCCAACGCC GTGGCCGATC CCGGCAATGG CATCGCCGGT 
CAGCTCGAGT CGGATCGCGA GGATCCCGCG GACCCGAGCT CGGGTGACGG CTTCGGCGAC 
GACTGCGACA ACTGCGCCCT GGTCCGCAAC CCGGATCAGG CCGATGCCGA CAACGACGGC 
GTGGGCGACG CCTGCGACAT CTGCGTGAAC GCGGCCGATC CCGACCAGGC CGATGCCGAC 
GGCGACGGCC TGGGCGACGC CTGCGACGTG TGTCCGAACA TCAGCGACGC CGACGCCCAG 
ATCGACGGCG ACGGCGACGG CGTGGGCGAT GCCTGCGACA ACTGTCCGAA CACGCACAAC 
CCGGACCAGC GCAAGTCCGA GCTGACGCGC GCCGATGGCA GCGAGCTCGG TTACGCTTGC 
GAGCCCGGCA TCCAGGGCGC GGGCGGCTGC TCGGCCCATC CCGCGATGAA CGGCCCCGCG 
GCGCCGGCCG CGCTGCTGGC GCTGCTGGCG CTGCTGGGCT TCGCGGCTAT CCGCCGCCGC 
CGCAGCTGA

Protein sequence

MSHRSYRASR DSSLTCGRAS LRPRAVFLAA LALALVAGAG LAGEARAQVP IECPAPVDCD 
AIGVCELADL NCNGILRCDD PASGTVGEGE CVDVCAQGIC STEVPDRRAC DDYFDPEGDG 
GQCTTDLNNA GVADSDGDCI GDACDNCIDI SNLAQLNRDN DLFGNACDNC IEVRNNDQAN 
ADEDLFGDVC DNCVDVANDD QANTDVAADA PGDSFGDACD NCVNVANEDQ ANADSDNFGD 
VCDNCVNVAN DQANADSDSF GDACDNCAGV ANEDQRNSDA EMDPPGDGFG DVCDNCLMVA 
NPDQADSDGD GLGDACDLCP DDDSDVDDQV DQDGDGLGDR CDVCPNVANA VADPGNGIAG 
QLESDREDPA DPSSGDGFGD DCDNCALVRN PDQADADNDG VGDACDICVN AADPDQADAD 
GDGLGDACDV CPNISDADAQ IDGDGDGVGD ACDNCPNTHN PDQRKSELTR ADGSELGYAC 
EPGIQGAGGC SAHPAMNGPA APAALLALLA LLGFAAIRRR RS