Gene NATL1_20701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_20701
Symbol	lysS
ID	4780175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1713935
End bp	1715476
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	38%
IMG OID	640085366
Product	lysyl-tRNA synthetase
Protein accession	YP_001015890
Protein GI	124026775
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1190] Lysyl-tRNA synthetase (class II)
TIGRFAM ID	[TIGR00499] lysyl-tRNA synthetase, eukaryotic and non-spirochete bacterial

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.290889
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTTGTATG TACCCATTGC CTTGTCTGAA TTAAGAGATA CCCGCCTCGA GAAGGCAAAA 
GCACTAAAAA CCCTTGGGAA AGGTCCCTAT GGTTTGAATT TTCGACCTAC TGACTCTGCC 
GCTGTTTTGC AGGGAAAATA TAAAGACTTG CCAAATGGCG AAGAAAAAAA AGACGAAGTA 
TCTATTGCAG GGCGAGTAAC TTCTAGAAGA GTGATGGGGA AACTTGCTTT TTTTACTCTT 
TCCGATGAAA CAGGCATAAT TCAACTCTTT TTGGAAAAGG CGACCTTAAA TCGGAATGAA 
GATAGTGAGA ATCCAAAGAA TAATTTTGAG AACATTACCT CTCTGGTTGA CTCTGGTGAT 
TGGATAGGAG TCAGTGGAAT ATTAAGGAGA ACTGATAGAG GTGAACTTTC TATAAAGGTT 
TTCGAATGGT CAATGCTATC AAAATCTTTA CAACCCCTAC CAGATAAATG GCATGGACTT 
GCCGATGTAG AAAAGCGCTA TAGACAAAGA TATTTAGATT TAATTGTAAA TCCACAGTCA 
AGAAAAACTT TTCGAACTAG GGCTTTATTA GTTAGTTCAA TTCGACGTTG GTTAGATGAA 
AAAGACTTTC TTGAAATCGA GACTCCAGTT TTACAATCAG AAGCTGGAGG AGCGGATGCA 
AGGCCTTTCA TAACTCATCA CAACACGCTC GATTTACCTT TGTATCTGAG GATTGCAACA 
GAATTGCATC TTAAAAGACT TGTGGTGGGT GGATTTCAAA GGGTCTATGA ACTTGGAAGA 
ATTTTTAGAA ATGAAGGGAT TAGCACTAGG CATAATCCTG AATTTACTTC TGTTGAAATT 
TATGAGGCCT TTGCAGATTA TTTCGACATG ATGGATTTAA CAGAAAAATT ACTTTCTTCA 
GTTTGCGAAA AGATTTGTGG ATCGACCAAA ATTAATTATC AAGAGCAAGA AATAGATTTG 
CAACCTCCTT GGAGAAGGGC CACGATGCAT GACTTAGTTA AGGAATTTAC TGGAATAGAT 
TTTGAATTAT TTGGAGACAA TGCTGATGAT GCTAAGGCTG AAATGAGTCG AGAGGGGCTT 
CAAGTGCCCG ATAAGGCTGA TACTGTTGGA ATCCTATTAA ATGAAGCTTT TGAACAAGCA 
GTAGAGCCTG AGCTGATTCA GCCTACATTT GTGATGGATT ATCCAATTGA GATTTCTCCA 
TTGGCTAGAA AACACAGAAC TAAAAAAGGT TTAGTGGAAA GATTTGAACT TTTTATTGTT 
GGTAGAGAAA CTGCCAATGC TTTTAGCGAA TTAATTGACC CTATTGATCA AAGAGAACGT 
TTACTTTTAC AGCAAGCGAA AAAAGAAGCA GGTGATCTTG AGGCTCAAAG CTTGGATGAG 
GATTTTATCA ATGCTCTTGA AGTCGGAATG CCTCCAACAG GAGGTCTCGG AATAGGAATA 
GATAGGTTTG TAATGTTGTT AACAGATAGT CCTTCCATAA GAGATGTAAT AGCTTTTCCA 
CTTTTACGAC CAGAAGCAAA TTTAAAACAA ACTGGAAAGT GA

Protein sequence

MLYVPIALSE LRDTRLEKAK ALKTLGKGPY GLNFRPTDSA AVLQGKYKDL PNGEEKKDEV 
SIAGRVTSRR VMGKLAFFTL SDETGIIQLF LEKATLNRNE DSENPKNNFE NITSLVDSGD 
WIGVSGILRR TDRGELSIKV FEWSMLSKSL QPLPDKWHGL ADVEKRYRQR YLDLIVNPQS 
RKTFRTRALL VSSIRRWLDE KDFLEIETPV LQSEAGGADA RPFITHHNTL DLPLYLRIAT 
ELHLKRLVVG GFQRVYELGR IFRNEGISTR HNPEFTSVEI YEAFADYFDM MDLTEKLLSS 
VCEKICGSTK INYQEQEIDL QPPWRRATMH DLVKEFTGID FELFGDNADD AKAEMSREGL 
QVPDKADTVG ILLNEAFEQA VEPELIQPTF VMDYPIEISP LARKHRTKKG LVERFELFIV 
GRETANAFSE LIDPIDQRER LLLQQAKKEA GDLEAQSLDE DFINALEVGM PPTGGLGIGI 
DRFVMLLTDS PSIRDVIAFP LLRPEANLKQ TGK