Gene Hoch_4973 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_4973
Symbol
ID	8547381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	6855832
End bp	6857322
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	70%
IMG OID	646389647
Product	DNA photolyase FAD-binding protein
Protein accession	YP_003269355
Protein GI	262198146
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID	[TIGR00591] photolyase PhrII

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.179925
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAATT CGCTCCCTCC CGTGCCGGCG CTGCGCGTGC GCGCCGTCGG CGATGCGCCG 
GTGCACGAGT CGCGGCGCTT TGTCTTGTAT TGGATGATCG CGGCCCGGCG CACGCGCTAC 
AACTTCGCGC TCGAGCGCGC GCTGGCCTGG TCGCGCGCGC TGGGCAAGCC GCTGGTGGTG 
CTCGAGGCCT TGCGCTGCGA CTATCCCTGG GCGAGCGAGC GCCTGCACCG CTTCGTCGTC 
GACGGGATGT CCGATCAATC GGCCGCGTTC GCGGATACCC CGGTGGCCTA CTATCCCTAC 
CTCGAACCGC GTCCCGGCGC GGGGCGCGGG TTACTGGCCG CGCTAGCCGC GCACGCCTGC 
GTGGTGGTCA CCGATGAGTT TCCGTGCTTC TTCCTGCCGC GCATGGTGGC CGCAGCCGCG 
CGCTCGCTCG ACGTGCAGGT CCAGGCGGTG GACGGCAATG GTCTGTATCC GCTGGCGGCG 
ACCGAGCGGG TGTTCACCAC CGCGGCCTCG TTTCGCCGCC ATCTGCAGAA AGAGCTGCCC 
GCGCATCTCG GCGATATGCC GATGGCCGAG CCGCTCGCGC ACGCGCCGCC ACGGGACGCC 
GCCCACGCGC TGCCGGCCGC GATCCGCAAG CGCTGGCCGC CGGCATCGCT TGGGCGTCCC 
GGCGCAAGCG ACGCGCTGCT GAGCGCGTTG CGTTTCGACC GCGCGGTCGA AGCTGCGCCC 
GTCCGCGGCG GGGCGCGGGC GGCGGGCGAG ACCCTGGAGC GCTTCGTACG CGCCGGTCTG 
CCGCGTTACC TCGAGGCCCG CAACCAGCCC GCGGACCCGG TCACCAGCCA GCTATCGCCG 
TATCTGCATT TCGGACACAT CTCGGCGCAC GAGGTGTTCC GCCGGGTCAT GGCCCGCGAC 
CAGTGGACGC CGGATCGTAT GGCCCCGCGC GCGACCGGCA GCCGCGAGGG CTTCTGGGGC 
GCCAGCAGCG AGGTCGAGGG TTTTCTCGAT GAGCTCATTA CCTGGCGCGA GATCGGCTAC 
AACATGGCCG CCAAGCGCGA TGACTACGAT CGCTACGAGT CGCTGCCGGC GTGGGCGCAG 
ACCACGCTCG AGGAGCACAC AGGCGACCCG CGGCCGCATC TCTACGAGCT CGACGAGTTC 
GAGCAGGCGC GCACGCACGA CGCGCTGTGG AACGCAGCCC AGACGCAGCT CGTGCGCGAG 
GGCCGCATCC ATAACTACAT GCGCATGCTG TGGGGCAAGA AGATCCTCGA GTGGACGCGC 
ACGCCGCGCG ACGCGCTGGC GGTGATGATC GAACTCAACA ACCGCTACGC GCTCGACGGC 
CGCAATCCCA ACTCGTACAG CGGCATCTTC TGGTGCCTGG GCCGCTACGA CCGCGCCTGG 
GGGCCAGAGC GCCCGATCTT CGGCAAGGTG CGCTTCATGA GCTCGCAGAG CACGGCGCGC 
AAGCTGCGCG TCACACCCTA CCTCCACGCC TACGCGCCCG CCGAAAGCTG A

Protein sequence

MANSLPPVPA LRVRAVGDAP VHESRRFVLY WMIAARRTRY NFALERALAW SRALGKPLVV 
LEALRCDYPW ASERLHRFVV DGMSDQSAAF ADTPVAYYPY LEPRPGAGRG LLAALAAHAC 
VVVTDEFPCF FLPRMVAAAA RSLDVQVQAV DGNGLYPLAA TERVFTTAAS FRRHLQKELP 
AHLGDMPMAE PLAHAPPRDA AHALPAAIRK RWPPASLGRP GASDALLSAL RFDRAVEAAP 
VRGGARAAGE TLERFVRAGL PRYLEARNQP ADPVTSQLSP YLHFGHISAH EVFRRVMARD 
QWTPDRMAPR ATGSREGFWG ASSEVEGFLD ELITWREIGY NMAAKRDDYD RYESLPAWAQ 
TTLEEHTGDP RPHLYELDEF EQARTHDALW NAAQTQLVRE GRIHNYMRML WGKKILEWTR 
TPRDALAVMI ELNNRYALDG RNPNSYSGIF WCLGRYDRAW GPERPIFGKV RFMSSQSTAR 
KLRVTPYLHA YAPAES