Gene Hore_04990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_04990
Symbol
ID	7314478
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	542198
End bp	543598
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	40%
IMG OID	643610922
Product	Deoxyribodipyrimidine photo-lyase
Protein accession	YP_002508252
Protein GI	220931344
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID	[TIGR00591] photolyase PhrII

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATACATA ATAGTAGAAT AAAACCCCTT AATAAAAAGA ATATAAATCC ACGCGGGGAA 
TATATTCTAT ACTGGATGCA GGCCTCCCAG AGAACAGAGT ACAACCATGC CCTGGAGTAT 
GCCATCATCG AGGCCAATAA ATCCAATAAA CCACTGCTTG TCTATTTCGG GATTGATACC 
TCATTCCCGG AGGCTAATCG ACGCCATTAT CAATTTATGC TGGAAGGGTT ACAGGAAGTA 
AAGAAATCCC TCTATAACCG GGGAATAAAA ATGATTATTG AATCCGTTCC CCCCGACAAG 
GATATTTTAA AGTTTGCAGA GTATGCCTCT CTCCTGGTAG TAGACAGGGG TTATCTTAAA 
ATCGAACGAA CCTGGCGAAA TAATGTGAGC CAACAGATTG ACTGTCCACT GATCCAGGTT 
GAAAGCAATG TAATAGTTCC TGTTGAAGTG GCCTCTTCTA AAGAAGAATA TGCTGCCTAT 
ACCATCAGAA AAAAACTATA CCGTAAGTTG CCTGAATTCC TCCATCCCTT ACATACCAGG 
ACCATCAGGG TAAGCTCCCT TGACCTGAAG CTATCATTTA TAAACTATAA GGATATTCCC 
CTTGATAATG TTACCCTGTG CCTTGATAGA TTAAAAGTTG ACAATACTGT ACCGGAAGTT 
AACTTATACC GGGGTGGCAC TACCCGTGCT CTGGCTTTAT ATAACGATTT TTTACATAAT 
AAAATTAAAG ACTACCATGA ATACCGGAAT GATCCTGTTA AAAACTGGAT TTCCAACATG 
AGCCCCTACC TCCATTTTGG ACAGGTCTCA CCCCTGCACC TAATTATTAA GGGGAATAAC 
TATTGTAAAA AACATGAAAT AGATAAAGGC TTTAAAGAAT TTTTTGAGGA GCTTGTAATC 
AGGAGGGAGC TATCTTTTAA TTTTGTATAT TATAACCCTG ATTATGATTC TATTAAATCT 
CTCCCGGACT GGGCTAAAAA AACTCTGAAA GAACATGAAA ATGACACCCG GGAATTTAGC 
TATTCACTTC AGGAATTGGA AGATGCTAAA ACCCATGACC CTTACTGGAA TGCTGCCCAG 
AAAGAACTTT TACTGACAGG TAAAATCCAT GGGTATATGA GAATGTACTG GGGCAAAAAA 
ATACTGGAAT GGACTTCCTC ACCTGACCTT GCCTATAAAT ATGCCCTGTA CTTAAATAAC 
AAATATGCCC TTGATGGTCG TGACCCCAAT GGGTTTGCCG GGGTAGCCTG GTGTTTTGGT 
AAGCATGACC GTCCCTGGCC CGGGTGTAAT ATATTTGGAA AGGTAAGGTA TATGAGTTCC 
GGTGGTCTTA AAAGAAAATT TAAAATAGAC TTATATTTAA AAAGAATACA TAACCTTGAG 
GAGGCATCAC ATGTTGGATA A

Protein sequence

MIHNSRIKPL NKKNINPRGE YILYWMQASQ RTEYNHALEY AIIEANKSNK PLLVYFGIDT 
SFPEANRRHY QFMLEGLQEV KKSLYNRGIK MIIESVPPDK DILKFAEYAS LLVVDRGYLK 
IERTWRNNVS QQIDCPLIQV ESNVIVPVEV ASSKEEYAAY TIRKKLYRKL PEFLHPLHTR 
TIRVSSLDLK LSFINYKDIP LDNVTLCLDR LKVDNTVPEV NLYRGGTTRA LALYNDFLHN 
KIKDYHEYRN DPVKNWISNM SPYLHFGQVS PLHLIIKGNN YCKKHEIDKG FKEFFEELVI 
RRELSFNFVY YNPDYDSIKS LPDWAKKTLK EHENDTREFS YSLQELEDAK THDPYWNAAQ 
KELLLTGKIH GYMRMYWGKK ILEWTSSPDL AYKYALYLNN KYALDGRDPN GFAGVAWCFG 
KHDRPWPGCN IFGKVRYMSS GGLKRKFKID LYLKRIHNLE EASHVG