Gene NATL1_14901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_14901
Symbol	lysA
ID	4781148
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1200167
End bp	1201531
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	36%
IMG OID	640084771
Product	diaminopimelate decarboxylase
Protein accession	YP_001015312
Protein GI	124026196
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0019] Diaminopimelate decarboxylase
TIGRFAM ID	[TIGR01048] diaminopimelate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.813083
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGGAT CAAAGGCTTA TGAACCTAAT GTGGATATTG ATAGTCCAAA TCGAAATATA 
GCTCCGATCA CTTCAGAAAT TAATGAGAGT AAAAAATTAG TTGTTGGAGG ATGTCAACTC 
AGTGAACTAG CGAAAAAATA TGGCACACCT CTTTATGTTT TAGATGAGTT TTCACTTAGG 
ACTGCATGCA AAACTTATAT TTCTTCTTTA AATAAACATT ACCCAGGGAA GTCACTTCCT 
CTATTTGCTT CAAAAGCAAA TAGCTCCCTA GCTATTTGTG CAGTTATTGC TTCTGAAGGT 
TTTGGGCTTG ATGCAGTATC AGAGGGTGAA TTACTTACTG CAATAAATGG AGGTGTAAAA 
GAGAAAGATA TTGTTTTTCA TGGAAATAAC AAATCTCAGG ATGAATTGAA TTTTGCCTAC 
AGTAATAATG TGACGATTGT TTTAGATAAT TATCATGATA TTGAGTTACT AAAAAATATT 
GCCTCCGATA ACAAGCCAGC AAAGTTAATG TTGAGGTTTA CTCCTGGAAT TGAATGTCAT 
ACTCATGAAT ATATAAGGAC TGGGCATTTA GATAGTAAAT TTGGTTTTGA TCCTGATGAT 
CTTAAGTCAA TTTTAGAAGA ATTAAAAACG TATAAGTGGG CTAATTTAAC TGGTTTACAT 
GCACATATAG GGTCTCAAAT TTTTGAAGTT CAACCCCATA TCGATCTTGC TGGCGTTATG 
GCTGATGCTT TAAAGCTTGC TAAGGAAATT GGTCATCCAG TTGTTGATCT AAATTTAGGA 
GGCGGTTTAG GGATTAAATA TGTTCAAGAA GATAATCCTC CCTCTATTGA AAAATGGGTT 
GAAATTATTT CTAAGGCTGT TGTTAAGGCT TGTAGGGAAA GAAATCTTGA TTTACCAAGA 
TTAATGTGTG AACCGGGAAG ATCTCTTGTC GCTAATTCGG GGCTCACTAT TTACAAGATT 
GGAGCTAAAA AAGTTGTCCC TGGTGTCAGA ACTTATTTAT CTGTTGATGG AGGGATGAGT 
GATAATCCTC GTCCAATAAC CTATCAGTCT CTTTACAGTG CATGTTTAGT CGATAAACCA 
ATGAATACAA ATTTTGAAAA AGTCACAATA GCCGGGAAGC ATTGTGAGTC TGGAGATGTT 
TTATTGAAAG ATTTTCTACT TCCTTCTTGT GAAAGTGGCG ATTTTCTTGC TGTGTTTGGA 
ACGGGTGCAT ACAACTATTC AATGAGTTCC AATTACAACA GAATACCTAG ACCTGCGACA 
ATTATGGTTG GGAAAGGTTC GGCCGAGTTG ACTCAAAGGA GAGAACTTCC TGAAGATCTA 
TTGCAATTAG ATGTATTGCC CGATCGCTTT ATTCCCAAGA ATTAG

Protein sequence

MHGSKAYEPN VDIDSPNRNI APITSEINES KKLVVGGCQL SELAKKYGTP LYVLDEFSLR 
TACKTYISSL NKHYPGKSLP LFASKANSSL AICAVIASEG FGLDAVSEGE LLTAINGGVK 
EKDIVFHGNN KSQDELNFAY SNNVTIVLDN YHDIELLKNI ASDNKPAKLM LRFTPGIECH 
THEYIRTGHL DSKFGFDPDD LKSILEELKT YKWANLTGLH AHIGSQIFEV QPHIDLAGVM 
ADALKLAKEI GHPVVDLNLG GGLGIKYVQE DNPPSIEKWV EIISKAVVKA CRERNLDLPR 
LMCEPGRSLV ANSGLTIYKI GAKKVVPGVR TYLSVDGGMS DNPRPITYQS LYSACLVDKP 
MNTNFEKVTI AGKHCESGDV LLKDFLLPSC ESGDFLAVFG TGAYNYSMSS NYNRIPRPAT 
IMVGKGSAEL TQRRELPEDL LQLDVLPDRF IPKN