Gene A9601_18281 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_18281
Symbol	lysS
ID	4718565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	1559871
End bp	1561337
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	32%
IMG OID	640079561
Product	lysyl-tRNA synthetase
Protein accession	YP_001010218
Protein GI	123969360
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1190] Lysyl-tRNA synthetase (class II)
TIGRFAM ID	[TIGR00499] lysyl-tRNA synthetase, eukaryotic and non-spirochete bacterial

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.505849
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAATAAAG GATTTGCTTC TTACGCACAA AGCTTTAAGG TATCACATAC TACCAGTTTT 
CTTATTCAAA AATTTGATCA TCTAGAAAAT GGTCAAGAGG AAGACTTCAG TGTTTCTATT 
GCTGGTAGAG TTCTGGCAAA AAGGGTAATG GGCAAAATTG CCTTTTTCAC AATAAGCGAT 
CAAGAAGGTC AGATTCAGCT TTATCTAGAT AAAAGGATTA TTAATTTCAA TTTAGAAAAA 
CAAAAATTAC TTTCTTTTGA AGATCTCAAA GAAATAGTAG ATATTGGTGA TTGGATAGGA 
GTCTATGGAA CTATTAAAAA AACTAATAAA GGTGAGCTTT CAATTAAAGT AGAAAAATGG 
GAAATGTTAT CCAAATCATT ACAACCTCTC CCAGATAAAT GGCATGGATT GACTGATATT 
GAAAAAAGAT ATAGACAACG TTATTTAGAT TTAATAGTTA ATCCTCACTC TAAAAATGTA 
TTTAAAACCA GAGCGAAATG TATAAGTTTT ATAAGAAAAT GGCTAGATAA TAGAAATTTT 
TTAGAGATAG AGACTCCAAT TCTGCAATCT GAAGCTGGTG GTGCTGAAGC AAGACCATTT 
ATAACTCATC ACAATACATT AGATATTCCG TTGTATTTAA GAATAGCTAC AGAATTACAT 
TTAAAGCGAA TGGTTGTTGG AGGTTTTGAG AAAGTCTATG AATTGGGAAG AATCTTCCGT 
AATGAGGGGA TAAGTACAAG GCATAATCCA GAATTCACCT CAGTGGAAAT TTATGAAGCT 
TATTCTGATT ATGTAGATAT GATGAATTTA ACTGAAGAAT TGATTAAAGA TATCGTAGCT 
GATGCATGTG GGTCCTTAAT TATAAATTAT CAAAATAAAG AAATTGATTT TTCTAAGCCT 
TGGTCAAGAA TATCCATGAA AGCTATTGTC AAAAAATATA CAGGGATTGA TTTTGATTCT 
TTCAGTGGAG ACTTTCTAGC AGCAAAACAA GCCGTTAAAA ATATCAATGT TGATTGTTCT 
AATAAAGTAA ATACTATGGG AAGACTTTTA AATGAGGTCT TCGAGCAAAA AGTAGAATCA 
AAACTTGTAG AACCCACTTT TGTTATTGAT TATCCTGTTG AAATTTCTCC TTTAGCTAGG 
CCTCATCATG ATAATAAACA AATAGTTCAG AGATTTGAAT TATTCATTGT TGGTAGAGAA 
CTGGCAAATG CGTTTAGTGA GTTGATAGAT CCAGTAGATC AAAGAGAAAG AATGCAATTA 
CAGCAATCTC TTAGAGACGA AGGAGATCTT GAGGCTCACT GTATAGATGA AGATTTTTTA 
AATGCTTTAG AGATTGGCAT GCCGCCTACG GGAGGATTAG GTATAGGCAT TGATAGGCTA 
ATTATGTTAA TTACTAATAG CGCATCGATT AGAGATGTAA TCCCTTTCCC ATTGTTAAAA 
CCAGAAATAA CTTCCAAAAA AAGTTAA

Protein sequence

MNKGFASYAQ SFKVSHTTSF LIQKFDHLEN GQEEDFSVSI AGRVLAKRVM GKIAFFTISD 
QEGQIQLYLD KRIINFNLEK QKLLSFEDLK EIVDIGDWIG VYGTIKKTNK GELSIKVEKW 
EMLSKSLQPL PDKWHGLTDI EKRYRQRYLD LIVNPHSKNV FKTRAKCISF IRKWLDNRNF 
LEIETPILQS EAGGAEARPF ITHHNTLDIP LYLRIATELH LKRMVVGGFE KVYELGRIFR 
NEGISTRHNP EFTSVEIYEA YSDYVDMMNL TEELIKDIVA DACGSLIINY QNKEIDFSKP 
WSRISMKAIV KKYTGIDFDS FSGDFLAAKQ AVKNINVDCS NKVNTMGRLL NEVFEQKVES 
KLVEPTFVID YPVEISPLAR PHHDNKQIVQ RFELFIVGRE LANAFSELID PVDQRERMQL 
QQSLRDEGDL EAHCIDEDFL NALEIGMPPT GGLGIGIDRL IMLITNSASI RDVIPFPLLK 
PEITSKKS