Gene NATL1_21161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_21161
Symbol	lysC
ID	4780251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1770703
End bp	1772469
Gene Length	1767 bp
Protein Length	588 aa
Translation table	11
GC content	38%
IMG OID	640085413
Product	aspartate kinase
Protein accession	YP_001015936
Protein GI	124026821
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0527] Aspartokinases
TIGRFAM ID	[TIGR00656] aspartate kinase, monofunctional class [TIGR00657] aspartate kinase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.926226
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATTGC TGGTTCAAAA ATTTGGCGGC ACCTCTCTAG GAAGTATTGA GCGCATAAAA 
GCTGTCGCGC AAAGAATCAA ATCAAGTAAA GAAAAAGGTG CTGATCTAGT AGTTGTTGTG 
TCGGCCATGG GACATCAAAC TGATGAGTTA ACACGGCTAG CGTCAGAAAT AACTGTTGAT 
CCTCCTCATA GAGAAATGGA TATGCTCCTC TCAACTGGGG AGCAAGTTTC AATATCATTA 
TTAACAATGG CCCTGAACGA ATTGGGCACA CCAGCAATCT CTTTGACTGG AACTCAAGCT 
GGAATTATCA CAGAATCAGC TCATGGAAGA GCCAGAATCC TCGAGATAAG GACAGAACGA 
ATAAAAAATC TCTTAGACCA AGGTCAAACC ATAGTTATTG CTGGATTCCA AGGAACAACT 
CTTGGCATAG GAGGAATTGC TGAAATTACA ACTTTAGGTA GAGGAGGTTC AGATACTTCT 
GCAGTAGCTC TAGCGGCATC GCTTGAAGCT GCTACATGTG AAATTTATAC CGATGTTCCT 
GGCGTACTTA CAACTGACCC AAGAATTGTG AAAAATGCAA AATTAATGAA AAGTATTAGT 
TGTGATGAAA TGTTAGAACT TGCCAGCCTT GGCGCAGCTG TTTTACATCC TCGAGCAGTT 
GAAATAGCAA GAAATTTCGG CGTAACTCTC GTCGTTAAAT CCAGTTGGGA CAACCTTGAT 
GGAACCACTC TAACTAGTAA TAAGAAGCCT GACTTTTCTC AAGGTGGAAT AGAACATCAA 
AGTCCTGTCG ATGGATTAGA ACTTCTTGAG AATCAAGCAG TCGTAGCTTT ATCTAATATT 
CCAGATCGTC CAGGAATTGC TGCGGAACTT TTTGAATCTT TATCAGAGGG TGGGGTGAAT 
GTCGATCTCA TTATTCAAGC GACACATCAA ATTGACTCTA ACGACATCAC TTTTACTATT 
GCTGAAAATG AATTACATAA TGCACTAACT CAATGTAAAA AACTCGTTAA TACTATTGGA 
GGTGATATCT CTTTTCAAAA AGATCTGACT AAACTAAGTA TTTATGGAGC TGGGATAATG 
GGAAGGCCTG GAATAGCGTC ATCGCTATTC CAAATTCTAT CTGACTCTGG TATTAATATA 
AGACTAATCG CAACTAGTGA AGTCAAAGTC AGTTGTGTTA TTGATGCAGA ATTAGGGAAA 
AAAGCACTAC GTAATGTAAG CGAAGTTTTC AAGCTCACTG ATAAACAAAT TACCGTGAAT 
CCTACGATTG AAAATAATAA CGAGCCAGAA GTAAGGGGAA TAGCTTTAGA TAAAGATCAA 
ATACAAATTA GCGTGAAGAA TGTGCCAGAT AAACCAGGGA CTGCCTCATC AATATGTTCC 
ACTTTAGCTG AGAAAAATAT CAGCTTAGAT ACTATAGTTC AATCTGAAAG AAAGCATAAA 
GATAAAACCA AAGATATCAG CTTCACTTTA AAGAAAAATG ATAGAAGCGA TGCTAAATAT 
GCATTAAAAG AATTGATTGA AAATTGGAAA GGAGCAAAAC TCGAAGAAGG AGAGTCAATA 
GTACGAATTA GCGCAGTAGG TTCTGGAATG CCTTTTACAA AAGGAACAGC CGGTAAAATT 
TTTAGAGCAC TAGCAAATCA AAAAATCAAC ATAGAAATGA TCGCCACAAG TGAAATAAGA 
ACAACTTGTA TTATCTCAGA AAAATATGGT GAAAAAGCAT TAAATGAAAT TCATTCTTGC 
TTTAAATTAG GAAAAAATAA AAGCTAA

Protein sequence

MALLVQKFGG TSLGSIERIK AVAQRIKSSK EKGADLVVVV SAMGHQTDEL TRLASEITVD 
PPHREMDMLL STGEQVSISL LTMALNELGT PAISLTGTQA GIITESAHGR ARILEIRTER 
IKNLLDQGQT IVIAGFQGTT LGIGGIAEIT TLGRGGSDTS AVALAASLEA ATCEIYTDVP 
GVLTTDPRIV KNAKLMKSIS CDEMLELASL GAAVLHPRAV EIARNFGVTL VVKSSWDNLD 
GTTLTSNKKP DFSQGGIEHQ SPVDGLELLE NQAVVALSNI PDRPGIAAEL FESLSEGGVN 
VDLIIQATHQ IDSNDITFTI AENELHNALT QCKKLVNTIG GDISFQKDLT KLSIYGAGIM 
GRPGIASSLF QILSDSGINI RLIATSEVKV SCVIDAELGK KALRNVSEVF KLTDKQITVN 
PTIENNNEPE VRGIALDKDQ IQISVKNVPD KPGTASSICS TLAEKNISLD TIVQSERKHK 
DKTKDISFTL KKNDRSDAKY ALKELIENWK GAKLEEGESI VRISAVGSGM PFTKGTAGKI 
FRALANQKIN IEMIATSEIR TTCIISEKYG EKALNEIHSC FKLGKNKS