Gene P9211_10961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_10961
Symbol	lysA
ID	5731074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	996900
End bp	998267
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	38%
IMG OID	641285463
Product	diaminopimelate decarboxylase
Protein accession	YP_001550981
Protein GI	159903637
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0019] Diaminopimelate decarboxylase
TIGRFAM ID	[TIGR01048] diaminopimelate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.297348
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.231621
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGTTT CAAGGCTCTT CGACTTAAAT AAGGATCAAA ACAGTCCCAA TAGAAACATA 
ACTCCAATTA CTGCTGAACT GGACAATTCA GATAGAATGA CAGTTGGCGG ATGTTTGCTT 
AGTGATCTTG CCAATCAATA TGGGACACCT CTTTATGTAA TTGATGAGGC CAGTATTAGA 
AGCTCTTGCA GGGCATATAG GAAGGCTCTC AAACAAAGCT ACCCTGGGGA TTCTTTTGTT 
TTATACGCCT CTAAAGCAAA TAGTTCTTTG GCTATTGATA GGATTGTTGC TTCAGAAGGA 
CTGGGTATAG ACGTAGTTTC CGAGGGTGAG TTAATTACAG CCTTAAAAAG TGGTGTCGCA 
GGGGAACAAA TTGTTTTACA TGGAAATAAC AAGTCTGACA AGGAGTTGTT ACTAGCGCAT 
GAGAGTAACG CAACTATTAT CATTGATAAT CAACATGATA TACAGCGCTT GGATAAACTA 
ATTAGCCATA AAGAAGGTAG TGTTAGATTA ATGTTACGCT TTACCCCAGG AATAGAATGC 
CATACGCATG AATATATTCG TACAGGTCAT TTAGATAGTA AGTTTGGGTT TGACCCTGAG 
CAAGTTTCAG ATACATTTGC ACAATTAAAG GATTATAAAT GGGCAAAATT AGTTGGTCTT 
CATGCACATA TAGGCTCTCA AATTTTCGAA TTATCACCTC ATATGGATTT GGTAGAAGTT 
ATGGCAGATT TCTTTTTAAG AGCAAAAGAT CTAGGTCATC CTATAAAAGA CTTAAATATT 
GGCGGAGGAC TTGGTGTTAA ATATATTCCT TCTGATGATC CCCCAGATAT TTATAGTTGG 
GTAGAAACTG TATCAAATGC TGTTATTAAA GCATTTGATA CAAGAAATAT TGAATTGCCA 
AGACTGATTT GTGAGCCTGG GAGGTCAATT ATTGCTACTG CAGGGCTAAC TCTCTATAGA 
ATTGGAGCTC GTAAAGATAT TCCAGGAGGA AAGACCTATC TGTCAATAGA TGGAGGAATG 
AGTGATAACC CTCGCCCAAT AACTTACCAA TCCACTTATA CAGCTTGTTT AGTTGACAGA 
CCATTGGCTA ATACTGATCA GGTCGTCACA ATTGCTGGAA AACATTGTGA ATCAGGAGAT 
ATTCTTTTAA ATAATATTGC TTTACCCACC GCTTCTAGTG GTGATGTCCT GGGTGTTTTT 
GGCACAGGAG CTTATAACCT TTCTATGAGC TCTAATTACA ATAGAATTCC AAGACCGGCT 
TCAGTTTTGG TTAATAATGC ACAGTCAGAT CTTGTTCAAG TAAGAGAGTT GCCTGAAGAT 
CTATTGCGAT ATGACCGCCT TCCAGATCGC TTTATTGCCA AAGGGTAG

Protein sequence

MGVSRLFDLN KDQNSPNRNI TPITAELDNS DRMTVGGCLL SDLANQYGTP LYVIDEASIR 
SSCRAYRKAL KQSYPGDSFV LYASKANSSL AIDRIVASEG LGIDVVSEGE LITALKSGVA 
GEQIVLHGNN KSDKELLLAH ESNATIIIDN QHDIQRLDKL ISHKEGSVRL MLRFTPGIEC 
HTHEYIRTGH LDSKFGFDPE QVSDTFAQLK DYKWAKLVGL HAHIGSQIFE LSPHMDLVEV 
MADFFLRAKD LGHPIKDLNI GGGLGVKYIP SDDPPDIYSW VETVSNAVIK AFDTRNIELP 
RLICEPGRSI IATAGLTLYR IGARKDIPGG KTYLSIDGGM SDNPRPITYQ STYTACLVDR 
PLANTDQVVT IAGKHCESGD ILLNNIALPT ASSGDVLGVF GTGAYNLSMS SNYNRIPRPA 
SVLVNNAQSD LVQVRELPED LLRYDRLPDR FIAKG