Gene NATL1_15641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_15641
Symbol
ID	4780521
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1269802
End bp	1271292
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	29%
IMG OID	640084846
Product	hypothetical protein
Protein accession	YP_001015386
Protein GI	124026270
COG category	[R] General function prediction only
COG ID	[COG3046] Uncharacterized protein related to deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.681049
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGAAAGA TTTTCCTGAT TTTTCCAAAT CAATTATTCA AAATAAAAAA ACAATTTACT 
GACGTTAGTC ATATTGCTCT GATCCAAGAT AGCTTATTTT TTGGTTGTGA TTCTCAATGG 
CAACAAAAGT TTCATTGTAA CAAAATAATT TTCCACAAAG CTACTATGGA CTCTTACGAA 
GAAGATCTCA AATCTCAGGG GTTCAATGTA ATTTATTTAA AACATCAAAG AGAAAGCAGA 
ACAGAAGATA ATCTCAATTA TCTCTCAGAA AAAGGTTTTA ACTATTTCAT CACTTATGAA 
GCGTTTGATT GGTCGCTAGA AAAAAGAATT AAGGATTTCT CTTTGAAAAA GAATATCAAG 
TTGGAAATAA GAAAAAATGA TATGTTTTTA ACTTGTAAAG ATATATCTGA AGAAATACTT 
AATCAAAAAA AAATTTATGG AATGCAGAAA TTTTATAAGA TTCAAAGAAA AAGCCTAAAT 
ATACTTATCG AAAAAGATGG TTCGCCAACA GGGGGGACAT GGAGTTTTGA CAAAATGAAC 
AGAAAGAAGC TTCCAAATTC AATTGAAGTT CCTAGAATAC CAACTATAAA AACAAGCAGA 
TTACTAGATA AAGCTAAGAA AGAAGTTTCT ATAAATTATA AAGATTATTA TGGGAGCACA 
GAAAACTTTA ATTATCCATT GTCTCATAAA GATGCTGAAG AATGGTTAGA TAATTTTTTA 
ATTGAAAGAT TTAATTTATT TGGAGATTAT GAAGATGCAA TACATTCAAA TCATAGGACA 
CTTTGGCATA GTGTTCTTTC TCCATTAATT AATTCCGGAT TACTTACTCC GAGACAAATA 
ATAGATAAAT CATGGGAGTT TTATCAATCA AACAATATTG GGATTAATTG CTATGAAGGA 
TTTGTTAGAC AAATTATTGG CTGGCGTGAA TTTATCCTAT TAATGTATAA ACGAAATAGT 
TTAGAACTAA GAAATGGAAA TTTCTGGGAT TTTGAGGACA AACCAATACC CTTAAGTTTT 
TACACTGGTC AAACAGGAAT AAGGCCTTTA GATGACTCAA TAAAAAATAT TTTAGAGACA 
GGATATGCTC ATCATATAGA AAGACTAATG ATAGTTGGAA ATTTAATGCT TCTATGCAGA 
TTTCATCCAA ATCAAGTATA CAAATGGTTT ATGGAATTAT TTATAGATTC ATATGATTGG 
GTTATGGTTC CAAATGTTTA TGGAATGAGT CAATTTTCAG ATGGAGGACT ATTTACAACC 
AAACCATATA TTTCTGGCTC TAATTATATT CGAAAAATGT CTAACTATAA ATCTGAAGAT 
TGGTGCTCAA CTTGGGATAG TCTTTTTTGG ACATTTATAG ATGATTATAA AAATAAGTTC 
AAGGACCAAT ATCGTTTGTC AATGATTTTA AGGAATTTAG AAAAAATGGA CCCTAATAAA 
AAAATGAACC ACAGACGTAA TGCTAATGAA TTCTTGTCTA AACTAAATTA A

Protein sequence

MRKIFLIFPN QLFKIKKQFT DVSHIALIQD SLFFGCDSQW QQKFHCNKII FHKATMDSYE 
EDLKSQGFNV IYLKHQRESR TEDNLNYLSE KGFNYFITYE AFDWSLEKRI KDFSLKKNIK 
LEIRKNDMFL TCKDISEEIL NQKKIYGMQK FYKIQRKSLN ILIEKDGSPT GGTWSFDKMN 
RKKLPNSIEV PRIPTIKTSR LLDKAKKEVS INYKDYYGST ENFNYPLSHK DAEEWLDNFL 
IERFNLFGDY EDAIHSNHRT LWHSVLSPLI NSGLLTPRQI IDKSWEFYQS NNIGINCYEG 
FVRQIIGWRE FILLMYKRNS LELRNGNFWD FEDKPIPLSF YTGQTGIRPL DDSIKNILET 
GYAHHIERLM IVGNLMLLCR FHPNQVYKWF MELFIDSYDW VMVPNVYGMS QFSDGGLFTT 
KPYISGSNYI RKMSNYKSED WCSTWDSLFW TFIDDYKNKF KDQYRLSMIL RNLEKMDPNK 
KMNHRRNANE FLSKLN