Gene P9301_04911 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_04911
Symbol
ID	4912498
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	428471
End bp	430171
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	29%
IMG OID	640160069
Product	secreted protein MPB70 precursor
Protein accession	YP_001090715
Protein GI	126695829
COG category	[K] Transcription
COG ID	[COG1293] Predicted RNA-binding protein homologous to eukaryotic snRNP
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.306879
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATATTA CATCTATTAG ATCTGTCTTG CATTATTTGA CAAAGAACAT CTTACCTACA 
AAGTTTGAGA CTGCCCAACA ACCAGAGCCT AATACAATTC AATTATGTTT TAGAGGAGTT 
GATTCTCAAA CATGGTTAGA AGTTTCATGG AATGGAGACT CCCCAAGAAT ACTAAAGATA 
AATAAGCCAG AAAAGATTGG GAGAGAAAGC ACACTTTCTA AACAAATAAG ATACGGATTA 
AAGTATATGG CTTTAATTTC GATTGATCAA GATGATTTCG AGAGAGTTAT TAAATTTAGT 
TTTGCGAAAA AACCTGGAGA TGAAATTAAT AAGTATTTAA TTTTTGAATT AATGGGAAAA 
CATAGTAATA TTTTTTATCT GGATAATAAA CATAAAATAA TTGCCGTTGG TAAACAAATT 
AAATCAAGTC AATCTAGTTT TAGAACAATT TCAACAGGAT CAATTTATTC TGGCCCTCCA 
GTCAATCTCA AAAAACAACC TAGAGAAGAT GAGTCTTTTC AATCATGGAA AGACTCAATT 
TCAATAGTAC CTGAGTCTTT GAAATACTGT TTAATAAATA CCTATCAAGG AGTAAGCCCT 
ATCCTCACAA AACAATTAGA GTTTGTTAGC GCAACTGTTA ATTCAGGAAT AATGGGAAAA 
AATATTGATT TCATTAGCAA CTCAGACTTA AAGGAGATAT TTAAAAATTG GAAGATTTGG 
ATAAACAGGT TTAAAAACAA TAACTTTAAT TTTTCTATAT TCAACAAAGA TTTTTATTGC 
GTTTGGTTTT TTGATAAGGA AATTAATTTC GAAAATAAAA AAGATTTATG CACAAGCTTA 
GAAAATTATT ATGATTATCA TCTGAAACAA AAAAAACTTG AATTATTGGA AAAGAAAATT 
GAAGGGATAA TTTTTAAACA GTCCAATACT GAGAAAAAGA ATTTAAATAT TCAATCTGAT 
CTTCTGACAA AATCAGAAAA CTACGAGAAA TATAAAGAAA AAGCTGATAA TATATTTGCC 
TCACATGAAA TTAAAAAACA AGACATTATA AAGGGACAAA AACTATATAA AAAATCAAAA 
AAACTAAAGA GATCTAGAGA ATTAATAAAA GAAAGATTAA GTATTTACAA AACAAATATA 
GAGAGATTAG ACGAATTCAC AACGCTTCTA GAAAATTTAA ATTCTTTAAA TCATGAAAAA 
CTTTCTATGA GAATCAAACT TCTAGAAGAA ATTATGGAAG AAATTTGTAA CGAGTTTAAT 
ATCAATATCA AGAAGCAAAG AGAAGATCAG AAAAGTACAT ATGAGATAGA GTCTTCACCA 
ATTCAAGTTG ACACTCCCAC AGGATTAAAG CTTCAGGTAG GGCGAAATAT GAGGCAAAAT 
GATTTAATAA GCTTTAAATT CTCAAAAAAA GGCGATTTAT GGTTTCATGC ACAGGAATCA 
CCAGGCAGTC ATGTAGTTTT GAAGTCTTCA TCTCAAGTAG CATCTGAACA AGATCTTCAA 
ATAGCTGCAG ATTTAGCTGC TTTATTTAGT AAGGCAAAAA GAAACATTAA AGTTCCAATT 
AATTTAGTAA GGATTAAAGA TTTACAAAAA ATCAAAAACG GAGGACCAGG TTGCGTTTCC 
TTTAAAAATG GAGAAATTAT TTGGGGAAAT CCTACAAGAG GAGAAGATTA CATTAAAAAA 
AATCTTAAAA CAGTAATTTA G

Protein sequence

MDITSIRSVL HYLTKNILPT KFETAQQPEP NTIQLCFRGV DSQTWLEVSW NGDSPRILKI 
NKPEKIGRES TLSKQIRYGL KYMALISIDQ DDFERVIKFS FAKKPGDEIN KYLIFELMGK 
HSNIFYLDNK HKIIAVGKQI KSSQSSFRTI STGSIYSGPP VNLKKQPRED ESFQSWKDSI 
SIVPESLKYC LINTYQGVSP ILTKQLEFVS ATVNSGIMGK NIDFISNSDL KEIFKNWKIW 
INRFKNNNFN FSIFNKDFYC VWFFDKEINF ENKKDLCTSL ENYYDYHLKQ KKLELLEKKI 
EGIIFKQSNT EKKNLNIQSD LLTKSENYEK YKEKADNIFA SHEIKKQDII KGQKLYKKSK 
KLKRSRELIK ERLSIYKTNI ERLDEFTTLL ENLNSLNHEK LSMRIKLLEE IMEEICNEFN 
INIKKQREDQ KSTYEIESSP IQVDTPTGLK LQVGRNMRQN DLISFKFSKK GDLWFHAQES 
PGSHVVLKSS SQVASEQDLQ IAADLAALFS KAKRNIKVPI NLVRIKDLQK IKNGGPGCVS 
FKNGEIIWGN PTRGEDYIKK NLKTVI