Gene A9601_03931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_03931
Symbol
ID	4717088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	349600
End bp	351096
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	28%
IMG OID	640078102
Product	putative deoxyribodipyrimidine photolyase
Protein accession	YP_001008788
Protein GI	123967930
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGAAA TAAATATCTT ATGGTTTAAG AAAGATTTAA GAATTTTTGA TAACGAAGCT 
CTCTGTGAGG CTATAAAAGA TAATGATATT TTACCTATTT ATATTATTGA GTTAGATATT 
TGGAGCCAAA ATACTCATTC AGATAGACAA TGGCAATTTT GCAAAGAAAG TTTAATAGAT 
TTAAGAAATG CACTTGCTGA GATTGGACAA CCATTAATTA TTAGGACTGG TAATGTTATT 
AATATATTTG ATGCAATTAG TTCAAAATTT AAAATCAAAG GTATATATAG CCATCAAGAA 
ACCGGAGATT GGCTTACTTA TAAAAGAGAT CAAAAAGTAA AAGAATGGGC TTTCAGCAAA 
AATATTATTT GGAAGGAATT TCTACAATTT TCAGTTTTCA GAGGAAATTT AGATAGGAAT 
AATTGGTCTA AAAAGTGGCA AAAAAATTCC GAAAAAAACT TACTTAAAGC TCCATTAAGA 
ATTAATTCTA TTAACTTTAA TACTGGAGAA ATACCCTCAG ACGAAATTTT TTCCTTTAAA 
AAAGAAACTT GTCCAGGAAG AATGCAAGGT GGAAGAAAGA AAGGTTTAGA GAGAATGCAA 
TACTTCTTTA GTAATAAATT AGATTCTTAT TCAAAAGATA TATCTAGCCC AGAAAAATCA 
TTTGATAGTT GTACAAGACT ATCCCCATAT ATTTGTTGGG GATGCATTTC ATTAAAAGAA 
ATTTTTCAAA AGGCAAATAT ATCAAAAAAC AATAATTCTA GGATGTTAAA AAGCAGATTA 
ACTTGGCATT GTCATTTTAT TCAGAAACTT GAAAGTGAAC CAGAACTAGA GTTTAGGGAA 
TACCATCCTT TTTTTAAAAA TATTAGAGAA AAAAATAATG AATTACTTTA TTCATGGAGT 
TCAGGTAATA CGGGCTTTCC TTTTATAGAT GCATGTATGC GCTCATTAAA TTTCCATGGA 
TGGATTAACT TCAGGATGCG GGCTATGTTA ATGTCTTTTG CTAGCTATAA TTTATGGCTA 
CCGTGGCAAG ACTCAGGTTC TGAATTAGCA AATAAATTTG TAGATTATGA GCCTGGAATA 
CATTGGAACC AATGCCAAAT GCAATCTGGA ACTACATCTA TAAATACCAA TAGAATTTAT 
AATCCTATTA AGCAGGGAAA AGATCATGAT CCACAAGGAA AATTTATAAA AAAATGGTTA 
CCAGAATTAA AGGATTTATC ACTTAATTTC ATTCATGAAC CATGGTTATT ATCTAGATTT 
AATAAAGAAG AATATGAACA AATTAATTAC ATAAGACCAA TAATTGATAT CCCAAATAGC 
ACTAAAAATG CAAAGAAGAA AATTCAGGAA ATAACTAAAA AGGATGGATA TTGGGATATC 
TCAAAAGAAA TTTATTTAAA ACATGGCTCC AGAAAAAGGC TTAGAAAAAA TATAAATAAT 
AAAAAAATTA TTTCTAGGGA AAAGGAAATA CAATACGAAT TGAAATTAGA TTTCTAA

Protein sequence

MKEINILWFK KDLRIFDNEA LCEAIKDNDI LPIYIIELDI WSQNTHSDRQ WQFCKESLID 
LRNALAEIGQ PLIIRTGNVI NIFDAISSKF KIKGIYSHQE TGDWLTYKRD QKVKEWAFSK 
NIIWKEFLQF SVFRGNLDRN NWSKKWQKNS EKNLLKAPLR INSINFNTGE IPSDEIFSFK 
KETCPGRMQG GRKKGLERMQ YFFSNKLDSY SKDISSPEKS FDSCTRLSPY ICWGCISLKE 
IFQKANISKN NNSRMLKSRL TWHCHFIQKL ESEPELEFRE YHPFFKNIRE KNNELLYSWS 
SGNTGFPFID ACMRSLNFHG WINFRMRAML MSFASYNLWL PWQDSGSELA NKFVDYEPGI 
HWNQCQMQSG TTSINTNRIY NPIKQGKDHD PQGKFIKKWL PELKDLSLNF IHEPWLLSRF 
NKEEYEQINY IRPIIDIPNS TKNAKKKIQE ITKKDGYWDI SKEIYLKHGS RKRLRKNINN 
KKIISREKEI QYELKLDF