Gene P9301_03921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_03921
Symbol
ID	4911828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	347540
End bp	349036
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	28%
IMG OID	640159968
Product	putative deoxyribodipyrimidine photolyase
Protein accession	YP_001090616
Protein GI	126695730
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.322027
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGGAA TAAATATCTT ATGGTTTAAG AAAGATTTAA GAATTTTTGA TAACGAAGCT 
CTCTGTGAGG CTATAAAAGA TAATGATATT TTACCTATTT ATATTATTGA GTTAGATATT 
TGGAACCAAA ATACTCATTC AGATAGACAA TGGCAATTTT GCAAAGAAAG TTTAATAGAT 
TTAAGAAATG CACTTGCTGA GATTGGACAA CCATTAATTA TTAGGACTGG GAATGTTATT 
AATATATTTG ATGAAATTAG TTCAAAATTT AAGATCAAAG GTTTATATAG CCATCAAGAA 
ACCGGAGATT GGCTTACTTA TAAAAGAGAT CAAAAAGTAA GGGAATGGGC TTTAAGTAAA 
AATATTATTT GGAAGGAATT TCTACAATTT TCAGTTTTCA GAGGAAATTT AGATAGGAAT 
AATTGGTCTA AAAAGTGGCA AAAAAATTCT GAAAAAAACT TACTTAAAGC ACCATTAAGA 
ATTAATTCTA TTAACTTAAA TATTGGAGAA ATACCCTCAG ACAAAATTTT TTCCTTTAAA 
AAAGAAACTT GTCCAGGAAG AATGCAAGGT GGAAGAAAGA AAGGTTTAGA GAGAATGCAA 
TACTTCTTTA GTAATAAATT AGATTCTTAT TCAAAAGATA TATCTAGCCC AGAAAAATCA 
TTTGATAGTT GTACAAGACT ATCCCCATAT ATTTGTTGGG GATGCATTTC ATTAAAAGAA 
ATTTTTAAAA GGGCAAATAT ATCAAAAAAC AATAATTCTA GGATGTTAAA AAGCAGATTA 
ACTTGGCATT GTCATTTTAT TCAGAAACTT GAAAGTGAAC CAGAACTAGA GTTTAGGGAA 
TACCATCCTT TTTTTAAAAA TATTAGAGAA AAAAATAATG AATTACTTTA TTCATGGAGT 
TCAGGTAATA CGGGCTTTCC TTTTATAGAT GCATGTATGC GTTCATTAAA TTTCAATGGA 
TGGATTAACT TCAGGATGCG AGCGATGTTA ATGTCTTTTG CTAGCTATAA TTTATGGCTA 
CCATGGCAAG ATTCAGGTTC TGAATTAGCA AATAAATTTG TAGATTATGA GCCTGGAATA 
CATTGGAACC AATGCCAAAT GCAATCTGGA ACTACGTCTA TAAATACGAA TAGAATTTAT 
AATCCTATTA AGCAGGGAAA AGATCATGAT CCTCAAGGTA AATTTATAAA AAAATGGATA 
CCAGAATTAA AAGATATATC ACTTAATTTC ATTCATGAAC CATGGCTACT ATCTATATTT 
AATCAAGAAG AATATGAAAA AATTAATTAC ATAAGACCAA TAATTGACAT CCCAATTAGC 
ACTAGAACTG CAAAGAAGAA AATTCAGGAA ATCACTAAAA AGGATGGATA TTGGGATATC 
TCAAAAGAAA TTTATTTAAA GCATGGCTCA AGAAAAAGGC CTAGAAAAAA CATAAATAAT 
AAAAAAAATG TTTCTAAGGA AAAGGAAAAA CAATACGAAC TGAAATTAGA TTTCTAA

Protein sequence

MKGINILWFK KDLRIFDNEA LCEAIKDNDI LPIYIIELDI WNQNTHSDRQ WQFCKESLID 
LRNALAEIGQ PLIIRTGNVI NIFDEISSKF KIKGLYSHQE TGDWLTYKRD QKVREWALSK 
NIIWKEFLQF SVFRGNLDRN NWSKKWQKNS EKNLLKAPLR INSINLNIGE IPSDKIFSFK 
KETCPGRMQG GRKKGLERMQ YFFSNKLDSY SKDISSPEKS FDSCTRLSPY ICWGCISLKE 
IFKRANISKN NNSRMLKSRL TWHCHFIQKL ESEPELEFRE YHPFFKNIRE KNNELLYSWS 
SGNTGFPFID ACMRSLNFNG WINFRMRAML MSFASYNLWL PWQDSGSELA NKFVDYEPGI 
HWNQCQMQSG TTSINTNRIY NPIKQGKDHD PQGKFIKKWI PELKDISLNF IHEPWLLSIF 
NQEEYEKINY IRPIIDIPIS TRTAKKKIQE ITKKDGYWDI SKEIYLKHGS RKRPRKNINN 
KKNVSKEKEK QYELKLDF