Gene Hoch_2169 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2169
Symbol
ID	8544555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	3018384
End bp	3019520
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	63%
IMG OID	646386876
Product	cysteine-rich repeat protein
Protein accession	YP_003266607
Protein GI	262195398
COG category
COG ID
TIGRFAM ID	[TIGR02232] Myxococcus cysteine-rich repeat

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0145186
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGGGA CGCGATGGAG AGGAATAGGC TGGGCGTGCG TGCTGGGCGT GGCGCTGGCC 
GCTGTCGGCT GCCTGGTGGA GACGAACACG AGCGAATGCG CGAGCGGGCT GCGCTGCCCG 
ACCGACGCCT ACTGCGCCGA TGACGGCAAG AGCTGCATCA CCGGCCTGTG CGGCAACGGC 
CGCCTGGATG TCGGCGAGGT GTGCGACGAT GGCAACGATC GCTCCATGGA CGGTTGCCGC 
GCCGACTGCC TGTCCGATGA AAGCTGCGGC AACGGCGTGC ACGATCCGCA GGTGGGCGAA 
CAGTGCGATG ATGGCAATCG GGTTTGGGAT GATACCTGCT CGCCCGATTG CCTCCTGCCG 
CGTTGCGGTG ATGGCGAGGT CACCAAAGGC GAAGAATGCG ACAGCGGCGG TGTGGATTCC 
GCAGGGTGCA ACTACGACTG CCGGGCGCCG GTGTGCGGCG ATGGCTACGC CAACCTCGTC 
GCTTCCAATA CCGGGACGCC CGATATCCCC AACGATCGCG AGGAGTGCGA CAGTTGGGGG 
GAAGACTCGC CATCGTGCGA CTTCGATTGT ACCCGGCCCG TGTGCGGTGA TGGTTACCTC 
AACCGAGACG CATTGAATAC CGGGACGCCG GATATCCCGG ATGATAAAGA GACGTGCGAC 
ACGGGCGGTG TGAACACGGC AACCTGCGAT TATGATTGCA CCGTCGCCGA GTGCGGAGAC 
GGATTTTTTA ACCCGGAATT TGTCCTGGCG TCCGGTTTTC CTGAGGAGTG CGACACTGGC 
ACATCAACAG TGGCTTGCGA TGGTGACTGT ACCGCCGTGG TCTGCGGCGA TGGCTTTGCG 
AACGCAGCGG CCGGTGAGAC CTGCGACGAC GGCAACAGTA TACTGACGGA TGACTGTCCG 
TCGGGTCCGC GCGGCATCTG CAAAGTCGCC ACCTGTGGAG ATGGGTTTCT CCACGAGGAC 
GAAGGCTGCG ACGATGGTGA CAACAGCACC ACCGATGGCT GCCCCTCTGG CCCGAATGGC 
TCGTGCGAGC CGGCGTACTG TGGCGATGGA TTTCGGCGCG CTGGTGTAGA GGAGTGCGAG 
CGCGACTCGC ATTGTCCGGG TCAATTGACC TGTCGCAGCG ATTGCAAATG CCGCTGA

Protein sequence

MRGTRWRGIG WACVLGVALA AVGCLVETNT SECASGLRCP TDAYCADDGK SCITGLCGNG 
RLDVGEVCDD GNDRSMDGCR ADCLSDESCG NGVHDPQVGE QCDDGNRVWD DTCSPDCLLP 
RCGDGEVTKG EECDSGGVDS AGCNYDCRAP VCGDGYANLV ASNTGTPDIP NDREECDSWG 
EDSPSCDFDC TRPVCGDGYL NRDALNTGTP DIPDDKETCD TGGVNTATCD YDCTVAECGD 
GFFNPEFVLA SGFPEECDTG TSTVACDGDC TAVVCGDGFA NAAAGETCDD GNSILTDDCP 
SGPRGICKVA TCGDGFLHED EGCDDGDNST TDGCPSGPNG SCEPAYCGDG FRRAGVEECE 
RDSHCPGQLT CRSDCKCR