Gene Phep_3718 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3718
Symbol
ID	8254850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	4436247
End bp	4437539
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	42%
IMG OID	644937380
Product	cryptochrome, DASH family
Protein accession	YP_003093971
Protein GI	255533599
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID	[TIGR02765] cryptochrome, DASH family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAATA AAAAAATACT CGTTTGGTTT AGGAATGATC TTCGCTTACA TGACAATGAG 
ATGTTGGTTG AAGCGATTGC TAAATCTGAC AGTATTTTAC CCGTTTATTT TTTTGATCCG 
CGTTATTTCG AAAATACAAG GTTTGGAACC GCAAAAACCG GGATAGTAAG GGCTTCATTT 
TTATTGGAAA GTATCTTGTC GTTAAGAAAA GCTTTTCAGC GGTTTGGCGG AGATATTTTA 
CTGGTGCAGG GGAAACCCGA AGATATGATC AGGGACCTGG TAGAACAGTT TGATATTGCA 
GAAGTATACC ATCACCGCGA AGTGGGCCCT GAGGAGACTG AAATTTCAGG CCATGTTGAA 
GATTTGCTGT GGACATTAAA GATCAATTTA AAGCATTTTA TCGGGCATAC ACTTTACAAT 
AAGGAAGACC TGCCATTTCC GATAAAGGAT ATCCCGGATG TATTTGCACA GTTTAAAAAG 
AAAACTGAAC GTGATGCGAT TGTGAAAGCC TGTTTTCTGA CACCGGAACA TATAGATTTC 
GTGGAAAATG CAGACTGGGG CCAATTGCCG TCATTAAAGG ACCTTGGTTT TGAAACTGTC 
GCCGGGGCTA TGATTGAAAA GTATGCGACT GGTGGCGAGG ATTCGGGATT GCAGCATTTG 
GCGCAATTAC TGGAAGCGGG TGCTGATATT TATTTGAAAC AAAATACTAA ACATACACCT 
GAAAAACCTG GTTTTTCTTC CCGCTTGTCT GCCTGGCTTA CCATCGGGTG CCTGTCGCCC 
AGAATGGTTT ACTGGAAGGT GAAGGAAGCA GAGGGGGTTT TTGGACTGAA TGCCAATTTT 
AGCCAGATCT TTCTGGGCCT TTTATGGAGG GATTATTTCC GGTTCATGTT TAAAAAGCAT 
GGCATTGCCT TTCTTCAGGA AACTGATCTG GAGAAAGACA TTATGCAGGC TATTGAAAGG 
GTGGATCCTG CCTTGGAAAA ATGGAAAACA GGCTGTACAG CACATCCGGT AGTTGATAAA 
TACATGTATG ACCTGAATGC TACTGGTTTT ATTCCTCATT CGGGCCGTTT ATTGGTGGCT 
ACTTATCTTG TTCATGTTTT AAAAATACAC TGGACCTGTG GTGCAGCTTA TTTTGAAGAG 
AAACTGATTG ATTATGCGCC GGCCAGTAAT TGGGGCAACT GGGCAAGCGT TGCCGGCATT 
GGTAAAGATG CCAGGTCGAA AAATACATTC GATTTAAACA AGCAGATCAA AATTTTGGAT 
ATTGCAGTTG CCGACAGCCC TTCTTTTGCC TGA

Protein sequence

MKNKKILVWF RNDLRLHDNE MLVEAIAKSD SILPVYFFDP RYFENTRFGT AKTGIVRASF 
LLESILSLRK AFQRFGGDIL LVQGKPEDMI RDLVEQFDIA EVYHHREVGP EETEISGHVE 
DLLWTLKINL KHFIGHTLYN KEDLPFPIKD IPDVFAQFKK KTERDAIVKA CFLTPEHIDF 
VENADWGQLP SLKDLGFETV AGAMIEKYAT GGEDSGLQHL AQLLEAGADI YLKQNTKHTP 
EKPGFSSRLS AWLTIGCLSP RMVYWKVKEA EGVFGLNANF SQIFLGLLWR DYFRFMFKKH 
GIAFLQETDL EKDIMQAIER VDPALEKWKT GCTAHPVVDK YMYDLNATGF IPHSGRLLVA 
TYLVHVLKIH WTCGAAYFEE KLIDYAPASN WGNWASVAGI GKDARSKNTF DLNKQIKILD 
IAVADSPSFA