Gene A9601_03081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_03081
Symbol	phrB
ID	4716995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	284525
End bp	285958
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	31%
IMG OID	640078010
Product	putative DNA photolyase
Protein accession	YP_001008703
Protein GI	123967845
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAAC CTAGAATACT TTTCTGGCAT AGAAAGGATT TAAGAATATT TGATAATCAA 
GCTTTAATCA AAGCATTTTC ATTATCAAAT GCTATTACTT CAACCTATAT ATTTGATAAA 
AATTACTCAC ACGATTTCAA TGCAAGTTCA AGAGCTTGGT TTCTAGGAAA TTCACTTCAA 
GAATTAGGAA ATAATTGGAA AAAAATGGGT AGTAGATTAG TTATGGAAGA AGGAGATCCG 
GTATTAATAA TTCCCAAATT AGCAAAGAAA ATAAATGCTA AATTTGTTTT TTGGAATAGA 
TCAATTGAAC CTTATGAGAT TAATCGCGAT TTACAAATAA AAAAAAATTT AAAAGAACAA 
AACATTCAAG TTATTGAAAC TTGGGATCAC TTATTAGTAG AACCTTTAAA AATATTTTCA 
GGGAATAATA ATCCTTATTC AGTTTATGGA CCTTTTTATA AAAACCTTAA ATCAAAAATG 
AATTTATTAG GTTTATATGA ACAAGATAAA GTTGGTTTCC AGTTTAAAGA TATTGATAAT 
AAACTCAAAG ATAAGACAAT AAATTCATCT GATTCGGTTT TAGAGAAATT TATCAAAAAT 
ATCAAATTTC CTGGTTCGAA TATTTGTCCA TGTAAACCTG GAGAGAATGC TGCAGAAACA 
TTATTAGAAA ACTTCATTAA CGAAAAAAAA ATATATTCTT ATAATTCTGC ACGAGATTTT 
CCTTCCCATA ATGGGACATC TTTTCTAAGT GCATCTCTCA GATTCGGTAC CATCAGCATT 
AGAAAAGTTT GGAACGCCAC TTTAAATTTA AATTCAGATT TGGAAAATCA AGGAAATTAT 
CTATCAATTG AAACTTGGCA AAAAGAACTT GTTTGGCGTG AATTTTATCA ACATTGCTTA 
TTCCATTTCC CAGAGCTAGA GAAAGGTCCC TATAGAAAAA AATGGGATCA CTTTCGATGG 
CAAAACAATA ATGAATGGTT TCAGCATTGG AGCAACGGAG AGACCGGAGT ACCTATAGTT 
GATGCTGCAA TGCGTCAACT AAATAGTACT GGCTGGATGC ATAACAGATG TAGGATGATA 
GTCGCTTCAT TTCTGGTAAA AGATCTTATA TGCAATTGGC AAATGGGCGA GAAAAAATTT 
ATGGAGACTT TGGTTGATGG AGACTTAGCT GCAAATAATG GGGGATGGCA GTGGAGCGCA 
AGTAGCGGTA TGGATCCAAA ACCTCTTAGA ATTTTTAATC CATATACCCA AGCAAAAAAA 
TTTGATCCTA TTTGCGAATA TATAAAATAT TGGATTCCTG AATTATCTAA AGTGTCAAAT 
TCAGAATTAT TAAATGGGGA TATATCTAAT TTAGAAAAAA ATGATTATTC AAGCCCTATT 
GTCAATCACA AGATACAACA AAGATTATTT AAATCACTTT ATGCTGAAAT TTGA

Protein sequence

MNKPRILFWH RKDLRIFDNQ ALIKAFSLSN AITSTYIFDK NYSHDFNASS RAWFLGNSLQ 
ELGNNWKKMG SRLVMEEGDP VLIIPKLAKK INAKFVFWNR SIEPYEINRD LQIKKNLKEQ 
NIQVIETWDH LLVEPLKIFS GNNNPYSVYG PFYKNLKSKM NLLGLYEQDK VGFQFKDIDN 
KLKDKTINSS DSVLEKFIKN IKFPGSNICP CKPGENAAET LLENFINEKK IYSYNSARDF 
PSHNGTSFLS ASLRFGTISI RKVWNATLNL NSDLENQGNY LSIETWQKEL VWREFYQHCL 
FHFPELEKGP YRKKWDHFRW QNNNEWFQHW SNGETGVPIV DAAMRQLNST GWMHNRCRMI 
VASFLVKDLI CNWQMGEKKF METLVDGDLA ANNGGWQWSA SSGMDPKPLR IFNPYTQAKK 
FDPICEYIKY WIPELSKVSN SELLNGDISN LEKNDYSSPI VNHKIQQRLF KSLYAEI