Gene NATL1_05661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_05661
Symbol	proS
ID	4780178
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	512261
End bp	514051
Gene Length	1791 bp
Protein Length	596 aa
Translation table	11
GC content	33%
IMG OID	640083843
Product	prolyl-tRNA synthetase
Protein accession	YP_001014393
Protein GI	124025277
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0442] Prolyl-tRNA synthetase
TIGRFAM ID	[TIGR00409] prolyl-tRNA synthetase, family II

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTCT CCCGCCTAAT GCTGAACACT CTTAGAGACG TCCCTTCAGA AGCAGATATA 
ATTTCACATC AGTTACTGGT AAGAGGTGGT TATATTAAGC GCATAACCGG AGGTATTTAT 
GCATATATGC CATTACTTTG GAAGGTTCTA AAAAAAATTA CCTCAATAGT TGAAGAAGAG 
TTATCAACAA AAGGTTGCCT GCAAACTCTT CTCCCTCAAC TTCAGCCTTC AGAAATATGG 
GAAAGAAGTG GGAGGTGGAA ATCATATACA CAGGGAGAAG GTATTATGTT TAGTCTTAAA 
GATAGACAAG GGAAAGAACT AGGACTGGGA CCAACGCATG AAGAAGTAAT TACGCAAATA 
ATTTCTCAAA CTATTCACTC TTACAAACAA TTACCGATAA ATATATTCCA AATTCAAACA 
AAATTTAGAG ATGAAATAAG ACCAAGATTT GGGTTAATGA GAAGTAGAGA ATTCATCATG 
AAGGATGCTT ATTCCTTTCA TGCAAATGAA AATGATCTTC AATCAACTTA TTCAGACATG 
AGAAATGCCT ATCAAAATAT ATTTACAAAA TGTGGTCTAG ATTTTGTTTG TGTCGACGCA 
GATAGTGGAG CAATTGGGGG TGCAGCATCT CAAGAATTCA TGGTAACAGC TGAGTCTGGG 
GAGGACTTAA TTTTGATAAG TTCTGATGGC AAGTATGGGG CTAATCAAGA AAAAGCTGTT 
TCCATTATTG AAGAAGGAAA CTTATTAGAA CCTAATAAAC CATCGATAAT TAAGACTCCT 
AATCAAAAAA CAATAGATGA ATTATGTAAT TACAATGATT TCCACCCAAG TCAAATTGTA 
AAAGTATTAG CTTATCTAGC AACGTGTGAT GATAATAAAA AATACCCAGT TCTAGTAAGT 
ATTCGGGGGG ATCAAGAAAT AAATGATATT AAACTTTCAA ATAAAATATC TCAAGAATTA 
AAGAAAAATG TACTTGATAT TAGAATTATT TATAATGAAG ACATGCAAAA GCAAGGCATT 
ACTAATATAC CATTTGGTTT TATAGGTCCT GATCTTAGCG ATAATTTACT TGCACAATCA 
AAAGGATGGG AAAAAAAATT CATAAGAATC GCTGACAATT CTGCAAAAGA TCTTAAAAGT 
TTTATATGTG GAAACAATAT TAAAGATGAG CATAAAATAT TTTATAATTG GAATCTAATT 
AATACTGTGC AACTGATATG TGATATTAGA AAAGCCAAAC CAGGAGACAG GTGTATTCAT 
GATAAAACAC AAAAACTTGA AGAATGTAGA GGGATAGAAA TAGGGCATAT ATTTCAATTA 
GGAACTAAGT ATTCTAAATC ATTAAATGCT ACTTTTACCA ACGAAAAAGG TATTGAAGAC 
CACTTGTGGA TGGGGTGCTA TGGAATTGGT ATTTCCAGAT TAGCTCAAGC AGCAGTAGAA 
CAAAATCATG ATGATTTAGG TATTATCTGG CCGACATCAA TTGCCCCTTT TACAGTAATA 
ATTATCATTG CCAATATAAA GAATAATGAT CAAAAATGTT TAGCTGAAGA TATCTATCAA 
AAATTAATAC AAAATCGAGT TGATGTTCTT CTTGACGATA GGGATGATAG GGCTGGGATC 
AAGTTTAAAG ATGCAGACCT TATTGGAATC CCATGGAGGA TTGTTGCTGG GCGAGAAGCT 
AGTTCGGGAC TAGTTGAATT ACATAATAGA AAAACAAAAA CTACAGAGTT GTTAGATCTG 
AACTCCGTTT TAAAAAAGCT TTCTGAAGAA TTTAATACTG AAAAACTATA A

Protein sequence

MRVSRLMLNT LRDVPSEADI ISHQLLVRGG YIKRITGGIY AYMPLLWKVL KKITSIVEEE 
LSTKGCLQTL LPQLQPSEIW ERSGRWKSYT QGEGIMFSLK DRQGKELGLG PTHEEVITQI 
ISQTIHSYKQ LPINIFQIQT KFRDEIRPRF GLMRSREFIM KDAYSFHANE NDLQSTYSDM 
RNAYQNIFTK CGLDFVCVDA DSGAIGGAAS QEFMVTAESG EDLILISSDG KYGANQEKAV 
SIIEEGNLLE PNKPSIIKTP NQKTIDELCN YNDFHPSQIV KVLAYLATCD DNKKYPVLVS 
IRGDQEINDI KLSNKISQEL KKNVLDIRII YNEDMQKQGI TNIPFGFIGP DLSDNLLAQS 
KGWEKKFIRI ADNSAKDLKS FICGNNIKDE HKIFYNWNLI NTVQLICDIR KAKPGDRCIH 
DKTQKLEECR GIEIGHIFQL GTKYSKSLNA TFTNEKGIED HLWMGCYGIG ISRLAQAAVE 
QNHDDLGIIW PTSIAPFTVI IIIANIKNND QKCLAEDIYQ KLIQNRVDVL LDDRDDRAGI 
KFKDADLIGI PWRIVAGREA SSGLVELHNR KTKTTELLDL NSVLKKLSEE FNTEKL