Gene Phep_2087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_2087
Symbol
ID	8253191
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	2408473
End bp	2409777
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	37%
IMG OID	644935735
Product	Deoxyribodipyrimidine photo-lyase
Protein accession	YP_003092354
Protein GI	255531982
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0527605
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0533895
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAGTA AAGTTTCGAT TTTTTGGTTT CGCAGAGATT TGCGTTTAGA AGATAATGTG 
GGTTTATATC ATGCCTTATC TTCAGGGTTT CCTGTCCTTC CTATTTTTAT TTTCGATGAA 
AATATCTTAG GAAAGCTTGG GGATAAAAAA GACAGAAGAG TGGATTATAT TGATCAGGCA 
CTTTTGAAAA TAAATACCCA ACTAAAATTA TCCAAAACAA GGCTGAACAC ATTTCACGGA 
AATCCGATTG AAATTTTCAA TATGCTTTCA GAGCAATATG CTGTCCAGGC TGTTTTTTGC 
AACAGGGATT ATGAACCGCT AACTATTCAA AGAGATGTGG AAATTTATGA GTTTTTTAAA 
CGGAACCAAA TTCCGTTTAA GGCATTTAAA GACCAGGTTA TTTTTGACAA AAGTGATGTT 
TTAAAAAATG ATGGGACCCC CTATACGGTT TATACACCTT ATTCAAAAAA ATGGAAAGAG 
CTATTGAAGG AAGAACATTA CAGGTCGTAC CATCCTGATT ATAATAATTT TTTCAGGCAA 
GAGTTTACCG GAATTCATTC CTTGAACGAT ATTGGTTTTG AAAAAACAGA CATCGCCTTT 
GAAACCCCGA AATTGACTAC TACAATCATT GATGAATACG ATAAATACAG AGATTATCCT 
GCAATGCAAC GCACCACACA GTTGGGGATT GCCCTTCGGT TTGGCACCAT CAGCATTCGC 
AAATGCGTAG CTTTTGGATT GAAACACAAT CAAACCTGGC TGAATGAATT AATTTGGCGG 
GAATTTTTTA TGCAAATTTT GTATCATTTC CCTAAAGTGG TCGATCAATC TTTCAAATCG 
AAATACGATA ATATCAAATG GCGAAACAAT GAGCATGAAT TTGATCGATG GTGCGAAGGG 
AAAACAGGTT ACCCGATTGT AGATGCAGGA ATGAGACAGT TGAACCAAAC AGGTTTTATG 
CACAATCGGG TACGGATGAT TGCAGCAAGC TTTTTGTGCA AGCATTTACT GATTGACTGG 
CGTTGGGGTG AAGCTTATTT TGCACAAAAG TTGAACGATT ACGATTTGTC GGCCAATAAT 
GGTAACTGGC AATGGGCATC AGGTTCGGGT TGCGATTCTG CACCTTATTT CAGGGTGTTT 
AACCCAACGC TTCAAACCGA AAAATTCGAT AAAAACTTCG CTTACCTCAA AAAATGGATT 
CCCGAGTTCG AAACAGAAAA CTATCCAGAA CCAATCGTGG AACATAGTTT TGCAAGAGAA 
AGAGCTTTGA AAACATATGG CAATGCCATC AAAGAAAACG ATTAA

Protein sequence

MKSKVSIFWF RRDLRLEDNV GLYHALSSGF PVLPIFIFDE NILGKLGDKK DRRVDYIDQA 
LLKINTQLKL SKTRLNTFHG NPIEIFNMLS EQYAVQAVFC NRDYEPLTIQ RDVEIYEFFK 
RNQIPFKAFK DQVIFDKSDV LKNDGTPYTV YTPYSKKWKE LLKEEHYRSY HPDYNNFFRQ 
EFTGIHSLND IGFEKTDIAF ETPKLTTTII DEYDKYRDYP AMQRTTQLGI ALRFGTISIR 
KCVAFGLKHN QTWLNELIWR EFFMQILYHF PKVVDQSFKS KYDNIKWRNN EHEFDRWCEG 
KTGYPIVDAG MRQLNQTGFM HNRVRMIAAS FLCKHLLIDW RWGEAYFAQK LNDYDLSANN 
GNWQWASGSG CDSAPYFRVF NPTLQTEKFD KNFAYLKKWI PEFETENYPE PIVEHSFARE 
RALKTYGNAI KEND