Gene A9601_15621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_15621
Symbol
ID	4718289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	1337981
End bp	1339135
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	27%
IMG OID	640079288
Product	DNA photolyase-like protein
Protein accession	YP_001009952
Protein GI	123969094
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.299984
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATTTT TATTAAAAGC ACAAAATACC TGGGAAAATT TTGCGAAATA CAAAATTAAT 
GATTATGCAA AATTAAGAAA TTTTGATTTT GGGCCAAATA ACGAAAGTTC AGTTTCAAAA 
TTATCGCCTT TCATTACTCA TAGAATATTA TCGGAATATG ATCTGATCCA TGATATTAAA 
AGTAAGTACA AAATCAAAAA TTCAACTAAA TTTGTTGAAG AAATATTTTG GAGAGTTTAC 
TGGAAAGGGT GGATGGAAAA TAGACCTAAA GTTTGGAGAA ATTTTATTTC AGAAAATAAT 
CTCGATTTTG ATTATGAGCT ATATGAAAAT GCAATTAATG GCAATACAGA ATTAGATTTT 
TTTAATTCTT GGGTTCATGA ATTAAAGCAG TACAACTATT TGCATAATCA TACAAGAATG 
TGGTTTGCGA GTACTTGGAT ATTTAATTTA GGCCTCCCAT GGCAATTAGG AGCAAAGTTT 
TTCTTTAAAT ATCTTTTTGA TGGAGATGCT TCATCTAATC TCCTTAGCTG GAGATGGGTT 
GGAGGATTGC AAACGAAGGG AAAACAATAT CTTTTTTCAT CATCAAACCT CAGAAAGTTT 
TCTAATAATA GATTTAATGT GGAAAAAATA AGTAATCAAC AAATTTTTCT TGAAGAATCT 
AATCAAATAC CATTTGAAGA TGAGATTTAT AAAAATGATA TGGATCCTAA ATCAGATAAT 
CTGATTATGT TTGAAAATGA TCTGCACCTT GCAACTCTTA AAAATTTACT TCCAAGCTAT 
AAAAAAGTAT TTATTATCCT TTTAAAAAAT GAACAAAGAC AAATTAAATT GTCTGAATCT 
GTTTTGAAAT TTAAACAAGA TTTGGTCTCT GAATTTGTAG AGCAATTTGA TAATGTTAAA 
CAGATTGATC CTTATTCACT GGAAAATACT TTTAAAAATA CCAATGAAAT AGACATTATT 
TATCCTGGAG TGGGAGAAAA TTATGATTTC ATAACTGAGT TTAAAAATTT ACACCATAAA 
GAAATTTTTA ATCTTGTGAG GGATGAAGAT TTATTTGCTT GGAAATTTGC TAAAAGAGGG 
TTTTTTAAAT TTAAAGAAAA TATTCCAAAA ATAAATCAGA GAATATTAGA AAATTTTTCA 
AAAAACAATT TTTAA

Protein sequence

MSFLLKAQNT WENFAKYKIN DYAKLRNFDF GPNNESSVSK LSPFITHRIL SEYDLIHDIK 
SKYKIKNSTK FVEEIFWRVY WKGWMENRPK VWRNFISENN LDFDYELYEN AINGNTELDF 
FNSWVHELKQ YNYLHNHTRM WFASTWIFNL GLPWQLGAKF FFKYLFDGDA SSNLLSWRWV 
GGLQTKGKQY LFSSSNLRKF SNNRFNVEKI SNQQIFLEES NQIPFEDEIY KNDMDPKSDN 
LIMFENDLHL ATLKNLLPSY KKVFIILLKN EQRQIKLSES VLKFKQDLVS EFVEQFDNVK 
QIDPYSLENT FKNTNEIDII YPGVGENYDF ITEFKNLHHK EIFNLVRDED LFAWKFAKRG 
FFKFKENIPK INQRILENFS KNNF