Gene P9303_25171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_25171
Symbol
ID	4778952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	2213628
End bp	2215148
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	44%
IMG OID	640088038
Product	hypothetical protein
Protein accession	YP_001018513
Protein GI	124024206
COG category	[S] Function unknown
COG ID	[COG5305] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAGA AAACGATTGC TCAGCCTGCC CATGATGCAC ATTCAGCGGC CTTTACAATA 
TTTTCCTTAC CATCGCCAAG CAGATGGAGA ATATGCCTAC TCATCATAGC CCTAATCTGC 
TCAGCAGCAT TCATCTTCAA AGCCTTAGTG GCGGTCAATC TCACCAGCCT TTGGAATGAT 
GAACTCTCCA CAGTAGAGAA ATCCTTCCAA CCATCACTAA GTTTTCTGAT TGACTATTTG 
CGTACCGATG TTCACCCTCC TTTTTATTAT GTCATTCTCT GGTTGACAGG AAAGATCTTC 
GGAGAAACTG TCATGGTGCT GAGGTCATTC TCCTGGGTCG CATATGTCGT TGGCTGTGCA 
GCAATAAGCG CTGCAGCCTG GAGCTATCAG AAATCATCAG TTGCCTCAAT CTGTGCGCTC 
TTACTGTCTT GCTCAATACC TTTCACAGTT AGCTATTCAG TCGAGGGCAA AGCTTATGCA 
TTCTTATTTG CATTGATCAG CATCGCACTA GTATTTCGCT TGCGCGTCAT ACAAAACAAA 
ACTAACTCGA GGTACTTATA CATACTTACA TATGCAGCAG TAGGTCTTAC TCATTATTAC 
GGACTTGGTC TATTAATTGC ACAAACATTA ATAGATGGAA TCCGTAAAAA AAGTCGCCTT 
TTTTCTTGTG GCTGCTTAGC TCTTCTACTG CCAAGCCTCT GGATGTTAAT CAACTTAGGA 
TTCTTGACTA GCCAAGAAGG ACGAGAATGG CTAGAGCCAA CGAGCCTTCT CTCACCAAAA 
TTACTTCGAT ATCTTCTTTT AACTGCCTTA GGTCCACACT GGCAACTAGT ACTTGCGATA 
GGCCTTGGAA CCTTCCTTCT ACTGAAATTC ACCCAAACAA ATACCTCTTC TCCCTCAAAC 
CTATTTCTCA TACAAGCATG GGGAGTAGAT GCAGGCCTGT TACTCTTAAT AATCACTTAT 
ACAATATCTA TCTGGAAGCC TTCTGCATTG CCTCGTTATT ATATAGTTCT AGCACCTGCT 
TGCCTAGGAG CCATTAGTTG CTGGCTAGGG GCACACATAC ATTCCAAAGA GCTGCTGAAA 
TGGCGCGGGG TTCTTCTAAC AGGAATCATA GCAATTCTAT TATCACTTTT CTGGACAGAT 
TCATTCACAA GAATAGCCCC AGAAAGCCCC TACAAACAAC GCAACGACTC AAATTACCGG 
GCCCTGTCTA TTAACGCAGC CGCAAGCAAA ATAAAGCTCA CGCGTCAATG CAGTGAGCTC 
AATGCCAGTG ATTATGTGCT AAGGCAAGGC AGACTATTAT TGCCAGGTCC AAACTGGACT 
TGCATCAATA ATAAAAGACT GCTTAAAATC GCTTCAAAAA TTAAAGTTGG CCAAGAAATC 
GTCATCGCTG ATAGCAAATC AAGCAACCTA CGTAAGCAGC GCTTACAGAA AGACGCCAAA 
GCGCTAGAAG CAATGGGATT CAACTGCTCC AAGGCAGAAA TGATCGAGCC TGCAAGTCAA 
GTCATACGTT GCTTGCGTTA G

Protein sequence

MNKKTIAQPA HDAHSAAFTI FSLPSPSRWR ICLLIIALIC SAAFIFKALV AVNLTSLWND 
ELSTVEKSFQ PSLSFLIDYL RTDVHPPFYY VILWLTGKIF GETVMVLRSF SWVAYVVGCA 
AISAAAWSYQ KSSVASICAL LLSCSIPFTV SYSVEGKAYA FLFALISIAL VFRLRVIQNK 
TNSRYLYILT YAAVGLTHYY GLGLLIAQTL IDGIRKKSRL FSCGCLALLL PSLWMLINLG 
FLTSQEGREW LEPTSLLSPK LLRYLLLTAL GPHWQLVLAI GLGTFLLLKF TQTNTSSPSN 
LFLIQAWGVD AGLLLLIITY TISIWKPSAL PRYYIVLAPA CLGAISCWLG AHIHSKELLK 
WRGVLLTGII AILLSLFWTD SFTRIAPESP YKQRNDSNYR ALSINAAASK IKLTRQCSEL 
NASDYVLRQG RLLLPGPNWT CINNKRLLKI ASKIKVGQEI VIADSKSSNL RKQRLQKDAK 
ALEAMGFNCS KAEMIEPASQ VIRCLR