Gene A9601_14861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_14861
Symbol
ID	4718207
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	1266344
End bp	1268449
Gene Length	2106 bp
Protein Length	701 aa
Translation table	11
GC content	31%
IMG OID	640079207
Product	hypothetical protein
Protein accession	YP_001009876
Protein GI	123969018
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGAACTTC CTTTAGACCA TTTTCGTTTA ATTGGCGTAA GCCCCTCTGC AACTTCTGAG 
GAAATATTAA GGGCGTTTCA ATTGCGGTTA GATAAAACAC CTGATGAAGG TTTTACTTAT 
GAAGTTTTAA CCCAAAGATC TGAGCTACTT CGCCTCACTG CCGATCTACT TACAGATCCA 
GAAAGCAGAA GAGAATACGA AAATTTGTTA TTAAATGGGA ATTCTGGATT GGATTTTTCC 
TCAAATAGAG AAGTAGCAGG ATTAATACTT CTTTGGGAAT CAGGTTCACC AAAAGAAGCT 
TTTAAAATAA CGAGAAAAGC ATTGCAACCC CCTCAAACCC CAGCTTTAGG AAGTAGTAGA 
GAAGCTGATT TAACATTATT GGCTGCTTTA ACAGCTAGAG ATTCTGCAAT ACAAGAACAA 
CAGCTTAGAT CCTATTCGAG CGCGTCAGAC TTTTTACATG AAGGTATAAA ACTTCTACAA 
AGAATGGGAA AGCTTGGAGA AAAAAGAAAA GAACTTGAAG AAGATTTGGC TGCTTTGCTT 
CCTTACAGAA TACTAGATCT ACTTAGTAGA GATCTAAATG ATCAAGACTC TCATAAAAAA 
GGTTTAAGTA TGTTGGAAAA TTTAATAATC AAAAGAGGTG GTTTGGAAGG TAATAATAAA 
TCTGAATATA AAGATTATTT AAATCAGCAA GAGTTTGAAG CTTTTTTTCA ACAAATAAAG 
CCATTTTTGA CAGTGCAAGA ACAGATTGAT TTGTTTCTTG AATTACAAAA AAGAGGATCA 
TTAGAAGCAG GATTTTTAGC GTTTCTATCT TTAACAGCTA TTGGTTTCTC TAGAAGAAAG 
CCAGAAAAAT TATTTGAAGC GAGAAGAATT TTAAAAAAAT TAAATTTATC AGGTCTTGAT 
TCAATGCCTC TAGTTGGTTG TTTAGATTTA CTTTTAGCTG ACATTGACCA AGCCTCTGCA 
AGGTTTTCAA GTAGTTCTGA TGAAAATTTA CGAGATTGGC TCAATAATTA TCCTGGAAAT 
AAGTTAGAAG CTATATGTAT TTTCTGTAAA AATTGGTTAG AAAATGATGT TTTAGTTGGG 
TATAGAGACA TTAACTCAAA AGAGGTGGAT TTAGATTCTT GGTTTGAAGA TAGGGAAATT 
CAAGAATTTA TTGAAAAATT AGAAAAGAAA ACAAAAAAAA TTGCAATTAG ATCAAATCTT 
CAAAACCAAC AAACTGAGAA GGAATCCTCC ACAAAAACGA CTGAAGATTT TGATAATGTA 
TTGGGGAATA TTGATGAAAG AAGATTACCT TGGCCTGGTG GCATAAAACA AGGCTATGAG 
AAGGTTGAGA CCAAAAAAAC AGAATTCAAT GAGGAATACT TTAAGAAAAA ACCAATTGAG 
TTTTATAATT TTTTAATTGA AAAAATTGCT GAATTTAAGT TTAGTTTTGG GGAATTCTTA 
AAGGATAAAG AGATAATTAA TCGGTCTCCG TATTTAATTT ATATCTATGC ATTTTTGATC 
TTATTTGCAT TTGGTATTGG TATTGGATTT TTAAGAAATA ATTTTAAAAA ATCAATTCAG 
GACGAATCTA TTGCTGAAAA ACCATTAATT GCAAAAGATA AAAATCAAAA GATTAGTGAG 
ATAGATATTA TTCAAGAAAT AAAAAAAAAT CCTTCAAATA AATTGAATTC TATTTCTGAG 
AAATCTACTT CAATTATTTC TTATGAATTC AAAGAACTTA ATACTGCTTC ACCTACTTTG 
GAAGATATAA AGAATTTAAT TAATAGATGG CTTCTTAATA AAAGTAATTA CTTAGAGGGA 
AAGGGTGAAA TTAATCTTTC TAAGATTGTT AGTAAAGGTC TAATTGATCG AACAATCGAA 
GAAAGACAGA ACGATATCAA GAAAGGAATT TATAAGGAGA TTAATTCCCA AATACTTAAA 
ATTGATTTGG AATCGCAAAC TTCATCTAGG ATAGTTGTTT TAGTAGAATT GAATTATTTA 
GAGAGGTTAG TAAAGAATTC GGGAGAATTT ATTAATGAAA CATCTTTAAA TCCCCTTAAA 
GTTAAATATA TTTTGGGCTT TTCAAATAAA TCGTGGAAAT TGGTTGATTT CGTGAGCGGC 
TTGTAA

Protein sequence

MELPLDHFRL IGVSPSATSE EILRAFQLRL DKTPDEGFTY EVLTQRSELL RLTADLLTDP 
ESRREYENLL LNGNSGLDFS SNREVAGLIL LWESGSPKEA FKITRKALQP PQTPALGSSR 
EADLTLLAAL TARDSAIQEQ QLRSYSSASD FLHEGIKLLQ RMGKLGEKRK ELEEDLAALL 
PYRILDLLSR DLNDQDSHKK GLSMLENLII KRGGLEGNNK SEYKDYLNQQ EFEAFFQQIK 
PFLTVQEQID LFLELQKRGS LEAGFLAFLS LTAIGFSRRK PEKLFEARRI LKKLNLSGLD 
SMPLVGCLDL LLADIDQASA RFSSSSDENL RDWLNNYPGN KLEAICIFCK NWLENDVLVG 
YRDINSKEVD LDSWFEDREI QEFIEKLEKK TKKIAIRSNL QNQQTEKESS TKTTEDFDNV 
LGNIDERRLP WPGGIKQGYE KVETKKTEFN EEYFKKKPIE FYNFLIEKIA EFKFSFGEFL 
KDKEIINRSP YLIYIYAFLI LFAFGIGIGF LRNNFKKSIQ DESIAEKPLI AKDKNQKISE 
IDIIQEIKKN PSNKLNSISE KSTSIISYEF KELNTASPTL EDIKNLINRW LLNKSNYLEG 
KGEINLSKIV SKGLIDRTIE ERQNDIKKGI YKEINSQILK IDLESQTSSR IVVLVELNYL 
ERLVKNSGEF INETSLNPLK VKYILGFSNK SWKLVDFVSG L