Gene P9303_17941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_17941
Symbol
ID	4778951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	1563868
End bp	1565082
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	40%
IMG OID	640087302
Product	TPR repeat-containing protein
Protein accession	YP_001017801
Protein GI	124023494
COG category	[R] General function prediction only
COG ID	[COG4785] Lipoprotein NlpI, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.398676
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGCTAG AGACTCCTGA AGCCATGGCA AATGAGTCGT CCAATCATTC CGTATCTGAG 
CAAACTGCAA ATGACTACTT CAAAGAAGGT GAAAAAAGAT TTCATTTAAA AGATTATCAA 
GGGGCAATTG ATTGTTACAG CAAAGCAATT GAGATCAATC CAAATAATGC CATTGCATAC 
AATAATCGAG GGAATGTAAA AGATGAACTA GGCGATTATC AAAGCGCAAT GAATGATTAC 
AATAAAGCAA TTGACATTAA CAGTCTGGAT GCCAGCTTTT ACATCAATAG AGGTGTCGTC 
AAGAGACACT CAAATAACAT CGAAGGGGCA ATCGATGATT ACACAAAAGC TATTGAACTA 
GATCCACAAC ACGCTACTGC TTATTACAAT AGGGGGATTG CTAAAGTCAA TCTAAGCGAC 
AACAAAGGGG CTATCTTTGA TTATACTAAG GCACTTACCG TAAATCCAAG ACATGCTAAA 
TCATACTACA ATAGAGCGAT TAGCAAAAAC AATATTAATG ATATCAAAGG GGCAATTTCT 
GATTACACAA AAGCAATTGA GGCCATGCCG GTGTTTGCCT CTGCCTATTA CAATCGCGGC 
AATTTAATGG AGAGACTGGG CCGAAGGCAA GCAGCGGTTA CTGACCATGA GAAGGCGCTA 
GTAATAAAAC CACAACTTCT CACTGCGATG AACGAGCGTG GTGAAAATAA AAACTTAGTT 
GAGAATAAGA TTGTAAATGA TTTGAACAAT GAAGAAGACA GAAGTCAGCT AGATGCATTT 
AATTATTATA GCCAAGGCAA TGCTGAACAA AAGCGAGGCA ACAATCAATC AGCGATCGAC 
TGTTACACCA AGGCGATAGA AGTCAATCCA CACTATGCCG AGGCATACAA CTACAGGGGC 
CTAGCTAATT ACAACCTTTG TGACTATCAA GCTGCGCTTG ATGATTACAA CAAGGCAATA 
GAAATTAACT CGATATATGA AGATGCCTAC ATTGGTTGCG GTCTTGCAAA GTCTGCATTA 
AGTGATTACC AAGGTGCAAT TGGAGCCTAT GAGAGGGTAC TAGTCATTAA CCCTAAGAAT 
GTTGCTGCCT ATAGAAATCG TGGTATTGCC AAAGAATTGG AGGGAAATCT AGAGGGTGCT 
TGTTCTGATT GGAGGCAGGC CTCCTCTCTG GGAGATGAAG ATGCTGCAGA ATGGGTAAAG 
GCACAATGTT TTTAA

Protein sequence

MALETPEAMA NESSNHSVSE QTANDYFKEG EKRFHLKDYQ GAIDCYSKAI EINPNNAIAY 
NNRGNVKDEL GDYQSAMNDY NKAIDINSLD ASFYINRGVV KRHSNNIEGA IDDYTKAIEL 
DPQHATAYYN RGIAKVNLSD NKGAIFDYTK ALTVNPRHAK SYYNRAISKN NINDIKGAIS 
DYTKAIEAMP VFASAYYNRG NLMERLGRRQ AAVTDHEKAL VIKPQLLTAM NERGENKNLV 
ENKIVNDLNN EEDRSQLDAF NYYSQGNAEQ KRGNNQSAID CYTKAIEVNP HYAEAYNYRG 
LANYNLCDYQ AALDDYNKAI EINSIYEDAY IGCGLAKSAL SDYQGAIGAY ERVLVINPKN 
VAAYRNRGIA KELEGNLEGA CSDWRQASSL GDEDAAEWVK AQCF