Gene Hoch_2030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2030
Symbol
ID	8544412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	2800489
End bp	2802048
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	68%
IMG OID	646386733
Product	deoxyribodipyrimidine photolyase-related protein
Protein accession	YP_003266468
Protein GI	262195259
COG category	[R] General function prediction only
COG ID	[COG3046] Uncharacterized protein related to deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0662893
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.30492
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTACTT CTCCGCGCGA TCTCTTCGTC ATCCTCGGCA ACCAGCTCGT CCCCTTTCGC 
CATCTGCGCC CGCATCGCGA TGCGGCGTTC TTCATGGCCG AGGACCTGGG TTTATGTACG 
TACGTCCGAC ATCACAAGCA GAAGATCGCC CTGTTCTTGG CCGCGATGCG CGCGCACGCG 
GACGAACTGC GGCGCAACGG CTGCGCGCTG CACTACGAGT CGCTGGACGA GCAGGCCGGA 
GCGGAGCTAC GCACCAAGTA CGAGACCAAG CTGGCCCGCT ACGCCGATCG CGCCGGACCG 
TTCGACCGGC TGCTGAGCTT CGAGGTCGAG GACCTGTTCT TCGAGCGCCG TCTCGACGCG 
GTGGCCGACG AGCTCGGGCT CGAGCGGGTG ACGCTGGCGA GTCCGATGTT TCTGTGCTCG 
CGCGAGCGCT TCGCCGGGTA CGCGCGCGGG GCCACGCGCT TGCGCATGGC CGATTTCTAC 
GAGCGCCAGC GCCGCCATCT GGGCATTTTG ATCGACAGCG AGGGCGCGCC GGTGGGCGGG 
CGCTGGAGTT TCGACCGCGA CAATCGCGAA AAACTGCCGC GGGATGAGTC CTTGCCGGCG 
GCGCCCGCGG CCGCGCCCAC CGATCACGTG CGCGCGCTCA TCGCCCTGGT CGGCGAGCGC 
TTTGCCGACC ACCCGGGCGA ACTCAGCGAG GCGGGCTGGT GGCTGCCGAG TACGCGGCGG 
CAGGCGCTGG CCTGGCTGCG CGGGTTTTTG GACGAGCGTC TCGAACGCTT CGGCGCCTAC 
GAGGACGCGC TGTCCACGCG CGGGCCGGTG CTGTTCCACA GCGTGCTCAG CCCGCTGCTC 
AACCTCGGCC TGATCACGCC GGACGAGGTG GTCGAGCGCA CGCTGGCGCA CGCCGAGGAC 
CACCGGGTGC CGCTCAACTC GCTCGAGGGC TTTCTGCGCC AGATCATCGG CTGGCGCGAG 
TTCGTACGCG GCGTCTACCG CGGCCATTCC GAGCAGCAGG AAACGGCCAA CGCCTGGGGT 
CACCACCGCC GCATGAAGCC GTGCTGGTGG GACGCGAGCA CCGGGCTGCG CCCGCTCGAC 
GACGCCATCG CCAAGGTGCT GCGGATGGGC TGGGCGCACC ACATCGAGCG GCTCATGGTG 
CTGTGCAATC TGATGAACCT GTGCGAGATC GAGCCGCGAC AGGTGCACGA TTGGTTTCTG 
GCCATGTTCG TCGACGCCGC CGACTGGGTG ATGGGGCCCA ACGTCTACGG CATGGGCCTG 
ATGAGCGACG GCGGCCTGTT CGCGACCAAA CCGTATATCT GCGCCAGCAA CTATCTGCTG 
AAGATGAGCG ACTACGGCCG GCCGGCGGCG GGCGAGGTGT TCCCCTTCGG CGACAGCGAC 
TGGTGCACGG TCGTCGACGG CCTGTACTGG CGCTTCGTGC GCGAGCACCG CGACTTCTTC 
GCCGGGCACC CGCGCATGGC GGTGATGGCG GCTTCCCTCG ACCGCATGTC CGGGGACAAG 
AAGCAGCGTA TCTTTGCGGC CGCGTCGGCG TTTCTCGACC GGGTGACCGA GACGCCCTGA

Protein sequence

MATSPRDLFV ILGNQLVPFR HLRPHRDAAF FMAEDLGLCT YVRHHKQKIA LFLAAMRAHA 
DELRRNGCAL HYESLDEQAG AELRTKYETK LARYADRAGP FDRLLSFEVE DLFFERRLDA 
VADELGLERV TLASPMFLCS RERFAGYARG ATRLRMADFY ERQRRHLGIL IDSEGAPVGG 
RWSFDRDNRE KLPRDESLPA APAAAPTDHV RALIALVGER FADHPGELSE AGWWLPSTRR 
QALAWLRGFL DERLERFGAY EDALSTRGPV LFHSVLSPLL NLGLITPDEV VERTLAHAED 
HRVPLNSLEG FLRQIIGWRE FVRGVYRGHS EQQETANAWG HHRRMKPCWW DASTGLRPLD 
DAIAKVLRMG WAHHIERLMV LCNLMNLCEI EPRQVHDWFL AMFVDAADWV MGPNVYGMGL 
MSDGGLFATK PYICASNYLL KMSDYGRPAA GEVFPFGDSD WCTVVDGLYW RFVREHRDFF 
AGHPRMAVMA ASLDRMSGDK KQRIFAAASA FLDRVTETP