Gene A9601_02051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_02051
Symbol	argS
ID	4716889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	188035
End bp	189849
Gene Length	1815 bp
Protein Length	604 aa
Translation table	11
GC content	27%
IMG OID	640077904
Product	arginyl-tRNA synthetase
Protein accession	YP_001008600
Protein GI	123967742
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0018] Arginyl-tRNA synthetase
TIGRFAM ID	[TIGR00456] arginyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTAATCA TTTTTAAAGA ATTAACAAAA CAATTTGAAC AATCTCTTTT AGATAGTCTT 
GAAAATAATG ATAAAAAAGG AGAATTCGAA ATTCTTCGAA AAAATTTAAT TACACAATCA 
TCAAAAGAGG AATTTGGTGA TTATCAATGT AATGTTTGTT TAAGTTTATC TAAAATATAT 
AAAAAGAACC CAAGAGATAT TTCTAATGAT TTTATTAACC TTTTAAATAA AAATAAAAGG 
ATATCAAAAT TATGTAAGAG TCTAGAAATA GCTGGACCTG GATTTATAAA TATAAAATTA 
AAAGATGAGG TTCTAATAAA TGAAATTAAG TCAAATATTC AATGCAATAG GGCTGGCATA 
CCTCTAATTA GAAAAGATTT AGAAAGTGGT TTATCCAATA AAGTTATTGT AGATTTTTCT 
AGCCCTAATA TTGCTAAAGA AATGCATGTA GGGCATTTAA GATCAACAAT AATAGGTGAC 
TCAATATCTA GAATTTTCGA GTTAAGAGGT TATGAAGTAT TAAGACTCAA TCATGTTGGT 
GATTGGGGAA CACAATTTGG CATGCTTATT ACTCAGCTCA AAGATTTATA TTCAAATGAT 
CTAGAAGAAA TAGGAAAGAT CAAAATAAGT GATTTAGTTG AATTTTATAA AGAATCAAAA 
AAAAGATTTG ATAACGAATC TGAATTCCAA AAAAGATCTA GAGAAGAAGT AGTTAAGTTA 
CAAAGTGGAG ATATTAAATC GATTAAAGCT TGGAAATTAT TATGTGATCA ATCAAGGAAA 
GAATTTGATG AAATCTATAA AAATTTAAAA ATAAAAATAG AAGAAAGAGG TGAATCTTTT 
TATAATCCCT TCTTAAAATC AGTTATTGAT GATTTGAATT TAGAAAAAAT ATTAGTAGAA 
GATCAAGGAG CAAAATGTGT ATTTTTAGAT GGGATGACTA ATAAAGAAGG CAAACCTTTA 
CCGCTAATTA TTCAAAAAAA AGATGGGGGT TTTAATTATG CCACTACAGA TCTTGCTGCT 
ATAAGATACA GATTCAATAA ACCTCCTAAT GGAGATGATG CTTCAAGAAT TATTTATGTA 
ACTGATCATG GGCAAGCAAA TCATTTTGCT GGAGTTTTTC AAGTTGCAAA AAAAGCAAAA 
TGGATCCCAG AAAATTGTCA AGTAGACCAT GTCCCTTTTG GGTTAGTTCA AGGAATTGAT 
GGCAAAAAAC TAAAGACAAG AGAAGGTAAA ACAATACGCC TAAAAGATTT ATTAAATGAA 
GCAGTTAGAA GAGCAAAAGA AGATTTATTG AAAAGATTAG AAGATGAAGA TCGTTATGAG 
ACCGAAGAGT TTATAGCAAA TACTTCAAGA ATTATTGGAT TAGGAGCTGT TAAGTATGCA 
GATTTAAGTC AAAATAGGAT TACCAATTAT CAATTTAGTT TTGATAAAAT GCTTTCCCTA 
AATGGTAATA CTGCTCCTTA TTTGTTATAT ACACTTGTAA GAATTTTAGG AATTAAAAGA 
AAAAATAATT TTGTTTATGA CTCTAAAGAT TTTCAGTACG TAAATTATGA ACATAAATCT 
GAGTGGAAAC TTATCAGAAA ATTACTTAAG TTCGATGAAG TCATAATTTC TATTGAAAAA 
GACTTAATGC CAAATAGATT ATGCAATTAT CTGTTCGAGC TATGTCAGAC TTTTAATAGA 
TTCTATGATC AAGTTCCAAT CCTCAAAGAA GAAAAAAATA TAAAAATTTC TAGGCTTAAT 
TTATGTGACC TAACTGCAAA AACACTAAAA TTAAGCTTAG AGATTTTAGG AATTGAAACT 
TTAGAAAGAA TGTAA

Protein sequence

MLIIFKELTK QFEQSLLDSL ENNDKKGEFE ILRKNLITQS SKEEFGDYQC NVCLSLSKIY 
KKNPRDISND FINLLNKNKR ISKLCKSLEI AGPGFINIKL KDEVLINEIK SNIQCNRAGI 
PLIRKDLESG LSNKVIVDFS SPNIAKEMHV GHLRSTIIGD SISRIFELRG YEVLRLNHVG 
DWGTQFGMLI TQLKDLYSND LEEIGKIKIS DLVEFYKESK KRFDNESEFQ KRSREEVVKL 
QSGDIKSIKA WKLLCDQSRK EFDEIYKNLK IKIEERGESF YNPFLKSVID DLNLEKILVE 
DQGAKCVFLD GMTNKEGKPL PLIIQKKDGG FNYATTDLAA IRYRFNKPPN GDDASRIIYV 
TDHGQANHFA GVFQVAKKAK WIPENCQVDH VPFGLVQGID GKKLKTREGK TIRLKDLLNE 
AVRRAKEDLL KRLEDEDRYE TEEFIANTSR IIGLGAVKYA DLSQNRITNY QFSFDKMLSL 
NGNTAPYLLY TLVRILGIKR KNNFVYDSKD FQYVNYEHKS EWKLIRKLLK FDEVIISIEK 
DLMPNRLCNY LFELCQTFNR FYDQVPILKE EKNIKISRLN LCDLTAKTLK LSLEILGIET 
LERM