Gene NATL1_20971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_20971
Symbol
ID	4781237
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1741129
End bp	1742310
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	29%
IMG OID	640085393
Product	hypothetical protein
Protein accession	YP_001015917
Protein GI	124026802
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.468089
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTACGT TTAATGATAT AAAAAGTTCA GAGCTTATAA TACACACAAG AAAAGTTCTT 
CTTAATAACG AAGGGGAGAC TATTAGTTAC TATATAGATA AAATAGAAGG AACGCAATAT 
CTAGATAAAT ATTATATAAA TTCTGGAATA TCGTACAAAG AGAGTAATTA TATAACCCTT 
GATTCACGTT TACATTCTAT TGAAGAAAAG AGTTTTTTAC GATCAGTATT TAGGAGATTA 
GATGAAGAAT TAGATCTTGA TTTTTTTGAG ATGTCTCATA ATAATGGATC AGATATTGAT 
ATTTTTCATG TAAATAGTTC TTCAATTTTT GATACAAATA CTATAGGCCA AGCAATAAAA 
CAAGAGCATC AATCAGGAGC ATGGTGGGAA TTATTTTGGA AAGACAGTGA CGAATTGAAA 
AAATTTGGAT CTTTAGAAAA AAATACAATC ATTCATGAAA TCGGTCACGC ATTAGGTTTA 
GCTCACCCTT TCAATGATCC TTTTAACAAA AATTACACGA CTCAAGACAC AATAATGTCT 
TACAATAGAG GTCCATCTGG ATGGAATGAA TGGTTTTCTA GTATCGACTT GCTTGCTCTA 
AAAAGTATTT GGAAAAGAGA AGATGATTTA GGAATAATAG AATATGAAAA CCCAAGTAAC 
AGTTACAAGT TTATTCGTGA AAATAATGAT TCATTATTTA TAAAAAGTGA GATAGGTAAT 
GAGTTGATTG ATGGCATACA AAATTTACAT TTCAGTGATC AAATTCTCAA CGTTAATGAA 
GACATACTCA GTGTATTCAA TGAACTCAAA GGAATTGACC ATATTACAGG ACAAATATAT 
AGACTATATA ATTCTGCTTT TGCAAGATTC CCTGATATAA ACGGTTTCAG ATATTGGATA 
GAAATGAATG AATCTGAAAA TAATACATAC TATCAAACAT CTGCTTCATT TATTAATTCA 
GCTGAATTTA AGAAATTGTA TTTTAATGAT CAATCGAACG AAGCATATAT ATACTCACTT 
TACAACAATA TTTTTAAGAG AGAGCCTGAT ACTGATGGCT ATGAATATTG GCTTGGACGA 
ATTGAAGGTA ACCACGAAAA TAAAAATGAT TTATTAATTG GATTTGCAGA ATCCATGGAA 
AGCAAAGAGC TATTTATGAA AGAAACATCT TTAAAATTTT AA

Protein sequence

MLTFNDIKSS ELIIHTRKVL LNNEGETISY YIDKIEGTQY LDKYYINSGI SYKESNYITL 
DSRLHSIEEK SFLRSVFRRL DEELDLDFFE MSHNNGSDID IFHVNSSSIF DTNTIGQAIK 
QEHQSGAWWE LFWKDSDELK KFGSLEKNTI IHEIGHALGL AHPFNDPFNK NYTTQDTIMS 
YNRGPSGWNE WFSSIDLLAL KSIWKREDDL GIIEYENPSN SYKFIRENND SLFIKSEIGN 
ELIDGIQNLH FSDQILNVNE DILSVFNELK GIDHITGQIY RLYNSAFARF PDINGFRYWI 
EMNESENNTY YQTSASFINS AEFKKLYFND QSNEAYIYSL YNNIFKREPD TDGYEYWLGR 
IEGNHENKND LLIGFAESME SKELFMKETS LKF