Gene P9303_24071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_24071
Symbol
ID	4775947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	2115761
End bp	2117629
Gene Length	1869 bp
Protein Length	622 aa
Translation table	11
GC content	45%
IMG OID	640087928
Product	hypothetical protein
Protein accession	YP_001018405
Protein GI	124024098
COG category	[R] General function prediction only
COG ID	[COG0457] FOG: TPR repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATCAAG AGGAGATTAT GCAGCAGCTG CAGGCAGCGG TTGCATTGCA TAACCAGGGT 
GAGCTTGATC AGGCAGAAGC GATTTATAGG CAAGTGCTTG CTGTTGATGA AAATAATTTT 
TATGCACTTA ATTTCTGCGG ATGTATTCAG CGCGAAAAGA AGAGATTCGA TGACGCGATT 
ACCTTGCTGA GCAGTGCAGT CTCCGCTCAG CCAGGTAATC CAGATGCTAA CTACAATCTT 
GGAAATGTCT TTAAGGACGC TGAGCGATGG GATGAAGCTA TCTCTTGCTA CGAGAAGACG 
CTTGACTTAA AAGCAGAGTA TCCAGAAGCA CTGAATAACC TGGGAATTTG TTTAAAGGAG 
ACTGAGCAAT ATGAGCATTC AGAGATTGTC CTGAAGCGTG CTATTTCGAG GCAGCCTAGG 
TTTGCAGCTG CCTGGCTCAA CCTAGGTAAT ACGCTCAAGG AGCAGAAAAA GTATTCAGAA 
GCGATTGTGA GTTATCGGAA CGCGATCGAG GTGAAGCCTG ATTTTGCGGA GGCTTATCTA 
AATTTAGGGA ATGTGTTGAA GGAGGAGGGA GAAGTTGAGG AAGCGATTGT AAGTTATCGG 
AAGGCAATTG AAGTTAAGCC TGATTGTGCT GGTGCGTATT TTTCTCTTGG TTTGGTGTTG 
AAGGGAGAGG GAGAAGTTGA GGAAGCGATT GTGAGTTATC GGAACGCGAT CGAGGTGAAG 
CCTGATTTTG CGGAGGCTTA TCTAAATTTA GGGTATGTGT TGAAGGAGGA GGGAGATGTA 
GAGGAAGCGA TCGCAAGTTA TCGGAAGGCA ATTGAGGTGA AGCCTGACTT TGTGAAAGCG 
TTTTTGGGAT TAGGGGCTGT ATTGACAGAG AAAGGTGAGA TTGATGACGC GCGACAAGTT 
GTTTCTGCTC TTTTCGAAAT GATTGCAATT GAGGAGTCAT ATATGCTTCC TTTCCCTTCT 
AGTAATTTGG TTTTTGAGTG GCATCACAGG CTGGCATTAC ATCTTTCTTG GGAATTGGAG 
TTTGCTGCCC TTTCTGGTTC TTCTGTGCCA TTCTCTGCAT TCGAAGCTGA GAAAAAAGTC 
GATGCTCAGC ATTTCCCTCC TTTGTTTTTG AAAGGAGAAG GCGATAGGGC AAGTAAACAG 
CGCTTGTATC GAAATGGATA TTTGGTGGAA GATCAGATAT TGTCTGAAAA TTTATGTGCT 
GAGTTTGTCA ATGAGTTTGA GGGTGTCAGG ATGATGACTG CAGGGTTGAT CCGTGCGGTA 
TCTGAGAAGG GCGTCTTAGG GTCTGTCTTG GATAAAATTT TCAAACACAC TGGTTTTCCG 
CACTTTGTAT GGGATTGTTT TTGCTTCGCA AAAGGACCTG ATACTGAGTC TGTGTCTGAT 
GCTTGGCATT ATGACAATCA TTACAATATT TGGACTCCCA AATTAATGGT TTATCTTAAT 
TCTCAGCGAG AAGAGGCTGG GGCAACGCAG TTTGTTGATG CGACTTTGTC CCAAAGGATT 
TCTGAGAAAT CTGATTATAT GGGCCTTGTT TGTCAGCGTA AATATTACAC AGAATACGTT 
AAGGCTTTGG AGGGCGAGCT AAGGCTTGAT CCTGTCACTT TTGATCCTCC TCATTACACC 
TTTTGCCCCG ACCGGGCCGG CACGGGTGTT TGGTTTTGTC CTGCACGAGT GCTGCATCGT 
GGCGTGAGTC CTAAGAAAGG ACTTCGCTAT GTGCTTACGT TTTCCTTGAC ACCTCTTCCT 
AGAGATTGTC AGTGGTCCAT GGAGCAGTGC GTCGAGAAGT CAGTAGAGAT ATTGAGGGAC 
AAGATTAAGC AAGGGATGAC AGAAATTGAT ATCAACCCCT TTTGGTCTGT ATCAAATAGG 
TCTGTATAG

Protein sequence

MNQEEIMQQL QAAVALHNQG ELDQAEAIYR QVLAVDENNF YALNFCGCIQ REKKRFDDAI 
TLLSSAVSAQ PGNPDANYNL GNVFKDAERW DEAISCYEKT LDLKAEYPEA LNNLGICLKE 
TEQYEHSEIV LKRAISRQPR FAAAWLNLGN TLKEQKKYSE AIVSYRNAIE VKPDFAEAYL 
NLGNVLKEEG EVEEAIVSYR KAIEVKPDCA GAYFSLGLVL KGEGEVEEAI VSYRNAIEVK 
PDFAEAYLNL GYVLKEEGDV EEAIASYRKA IEVKPDFVKA FLGLGAVLTE KGEIDDARQV 
VSALFEMIAI EESYMLPFPS SNLVFEWHHR LALHLSWELE FAALSGSSVP FSAFEAEKKV 
DAQHFPPLFL KGEGDRASKQ RLYRNGYLVE DQILSENLCA EFVNEFEGVR MMTAGLIRAV 
SEKGVLGSVL DKIFKHTGFP HFVWDCFCFA KGPDTESVSD AWHYDNHYNI WTPKLMVYLN 
SQREEAGATQ FVDATLSQRI SEKSDYMGLV CQRKYYTEYV KALEGELRLD PVTFDPPHYT 
FCPDRAGTGV WFCPARVLHR GVSPKKGLRY VLTFSLTPLP RDCQWSMEQC VEKSVEILRD 
KIKQGMTEID INPFWSVSNR SV