Gene Haur_1969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1969
Symbol
ID	5733858
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	2413635
End bp	2415095
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	52%
IMG OID	641279113
Product	deoxyribodipyrimidine photo-lyase
Protein accession	YP_001544740
Protein GI	159898493
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGTGA TTTGTTGGTT CCGCCGCGAT TTACGCCTAA CCGATCATCG CGCCTTGTAT 
GCCGCCGCCG AGGCCAGCGC TGGGGCAGTT ATTCCAGTCT TTATTTTGGA TGATACGATT 
CTGCACGATG GCTATGTTGG AGCAGCCCTG ATCGCCGTAA CGCTTGCCAT GCTCGAAGCA 
CTCGATCACG ATTTGCAGCA ACGAGGCAGT CGTTTGATTG TGCGCCATGG CCAGCCATTA 
GCCGAATTGC AACGCCTCGT GAGCGAAACT CAGGCCAGCG GCGTGTACTG GAATCGCGAT 
TATTTGCCTT ATGCGATCAA GCGTGATAGC GCAGTTAAGC ACTGGTTACG TGAACAAGGC 
TTGCAAGCCC ATTCGTTTCA CGATAGCGTT TTAGTTGAGC CAGAGGGGCT AAAAACCAAA 
ACTGAGCAAA AACCCTATGT GGTCTATGGA TCATATGTCA AGCGCTGGAG TGAATTAGCC 
TATCACCAAG CCGAGCAACT TGTGCCCGCC CCCAGCAAAT TCGTGGCCCC GCCAAGCGAT 
TTGGCGAGTT TGCCAATTCC AAGCTTGGCT GATTTGGGCT TTGAGCTACA ACAAACGATT 
CCACAGGTTG GCGAAACAAT TGCCCAACAA CGTTTGGCGC AGTTTTTTGA TCGGCGGCAG 
AAACTTTCGG TACTCAAGTA TACCAAAGCC CGCGAAGTGC CTGCCGAGGC CGGAACCTCG 
CAGCTTTCAG TTGATTTGCG CATGGGCACG ATTTCGATTC GCCAATGTTT GAAACAGGCT 
GTCGATCTGC TGACCGAGCC ATTAAACGCT GAGCAACGTC AAGGAGTCGA TACTTGGCTC 
AAAGAATTGG CTTGGCGCGA TTACTACACC CAATTGATCT ACCACAACCC ATATATGCTC 
AACGGCTCGC TCGATCCACG CTACGATCAG ATCATTTGGC GCAACGATCC AAGTGAGTTT 
TTGGCGTGGC AACAGGGCCA AACTGGGTAT CCAATTGTTG ATGCAGGCCA GCGCCAGCTC 
AACCAAATGG CGTGGATGCA TAATCGAGTG CGCATGATCA GCGCCTCATT TTTGATCAAA 
GATTTGCTGA TCGATTGGCG TTGGGGTGAG CGCTATTTTA TGCAGCAGTT ATGTGATGGC 
GACCCGACCG CCAATAACGG CGGTTGGCAG TGGGCAGCAG GTTCAAGTGG GCCATCAGCC 
CAACCCTATT TTCGCATCTT CAACCCAATT GCCCAGAGCA AAAAGCACGA CCCAGACGGC 
CAGTATATTC GGCGATTTGT GCCCGAATTA GCTAACGTGC CCGATCACTA TATTCACGAG 
CCATGGACCA TGCCGCCAGC CGTGCAAGCA CATGTTGGCT GCGTGATTGG GCGCGATTAT 
CCTGCGCCGC TAGTTGAGCA TAGTTTTGCC CGTGAACGCG CCTTGGCAGC CTATCGCACA 
GCCCTGCAAA CCAATGATTA G

Protein sequence

MPVICWFRRD LRLTDHRALY AAAEASAGAV IPVFILDDTI LHDGYVGAAL IAVTLAMLEA 
LDHDLQQRGS RLIVRHGQPL AELQRLVSET QASGVYWNRD YLPYAIKRDS AVKHWLREQG 
LQAHSFHDSV LVEPEGLKTK TEQKPYVVYG SYVKRWSELA YHQAEQLVPA PSKFVAPPSD 
LASLPIPSLA DLGFELQQTI PQVGETIAQQ RLAQFFDRRQ KLSVLKYTKA REVPAEAGTS 
QLSVDLRMGT ISIRQCLKQA VDLLTEPLNA EQRQGVDTWL KELAWRDYYT QLIYHNPYML 
NGSLDPRYDQ IIWRNDPSEF LAWQQGQTGY PIVDAGQRQL NQMAWMHNRV RMISASFLIK 
DLLIDWRWGE RYFMQQLCDG DPTANNGGWQ WAAGSSGPSA QPYFRIFNPI AQSKKHDPDG 
QYIRRFVPEL ANVPDHYIHE PWTMPPAVQA HVGCVIGRDY PAPLVEHSFA RERALAAYRT 
ALQTND