Gene Hoch_3551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3551
Symbol
ID	8545941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	4888617
End bp	4889672
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	70%
IMG OID	646388220
Product	YbbR family protein
Protein accession	YP_003267946
Protein GI	262196737
COG category	[S] Function unknown
COG ID	[COG4856] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00859415
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0365971
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTGGC TCGACGAACG CCGCGCCAAG CGTCAGCGCC GCAGCGGGGT GTGGCCGCGG 
CTCAGCCCGC CGAGCAAAGA GGAGCGCAAG GCCTCCTGGG ACGACGTCCG CCAGGGCCTG 
CGCCAGATGT TCACGCGCAA TCCGCTGCTC AAGCTGGTCT CGTTGGTGCT GGCGCTGTCG 
CTGTTCTTCC TGGTCAACAC CGACCGCGAC GCGATCATCG GCGTCAACGT CGATGTCTCC 
TACCAACTGC CCGAGAACCG CGTGCTGGTG TCGCAGCCGG TAGACCAGGT GCGGCTGTCG 
ATCCGCGGGC CCTGGCGGCG TATCAAGCGC TTCGACGAGC GCGAGATCGA CCGCATCCTG 
GTCGATCTGA CCAACGTCCA GGATGGTCCG TTCACCTTTC CCGAGGACGA GGTGGTCCTG 
CCCGAGGACC TGACCCTGCT GTCGATCAAC CCGCCGACCA TCAACGTGGC CTTCGAGCCC 
CGGGTGCAGA AGACCGTGCC GGTCGAGGTC GCCACCCAGG GCGAGCCCGC GCGCGGCTAC 
GAGGTCCAGC GCATCCTGCC AAAACCCTCG CAGGTGACGA TCCGCGGCGC CGAGACGCGG 
GTGCGCGAGA CCAACCGTGT GCACACGCGC GAGCTGCGCC TCGACGGCCG CACCGATTCG 
TTTACCGAGG TGCTGCCGCT GGAGCCGCCG CGCACCGAGC CGCGCTCGCT GATCGAAATC 
GCCGACCGCG TGCCCATCGA GGTCGAGGTG ATTCTGGCGC CCGAGATGGG CACGCGCACC 
ATCGAAGACG TGCCCGTGCG CATCGTGGCG GGCGAGGGCG TGAGCGAGGC GGTCGAGGAG 
CGCTTCGCGA CCGATCCGGC CACCGTGGAT ATCGTGCTGC ACGGGCCGCT GCTGGAGATC 
GAGAGCTTCA GCGGCGAGGT CACGGCGGTG GTGAGCGTGC ACGCCGAGGA CGGCACCGCG 
CGGCCGCGCA GCGCCGACAT CCAGGTGCGC AACGTGCCCG CCGGCGTCGG CACCGAGGTC 
AAGCCGCCCG CCGTGACCCT GCAGGGCGCG CGCTGA

Protein sequence

MSWLDERRAK RQRRSGVWPR LSPPSKEERK ASWDDVRQGL RQMFTRNPLL KLVSLVLALS 
LFFLVNTDRD AIIGVNVDVS YQLPENRVLV SQPVDQVRLS IRGPWRRIKR FDEREIDRIL 
VDLTNVQDGP FTFPEDEVVL PEDLTLLSIN PPTINVAFEP RVQKTVPVEV ATQGEPARGY 
EVQRILPKPS QVTIRGAETR VRETNRVHTR ELRLDGRTDS FTEVLPLEPP RTEPRSLIEI 
ADRVPIEVEV ILAPEMGTRT IEDVPVRIVA GEGVSEAVEE RFATDPATVD IVLHGPLLEI 
ESFSGEVTAV VSVHAEDGTA RPRSADIQVR NVPAGVGTEV KPPAVTLQGA R