Gene P9303_30181 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_30181
Symbol
ID	4778854
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	2672542
End bp	2674059
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	52%
IMG OID	640088542
Product	esterase/lipase/thioesterase family protein
Protein accession	YP_001019013
Protein GI	124024706
COG category	[R] General function prediction only
COG ID	[COG4188] Predicted dienelactone hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.157772
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGTTTT TTCGTTCCCG TCTTTGGCTG CTTGCAATCA GTTTTGGAGC AGGGCTTGGA 
CTTGTTCCAA GCTCTGCTCC TGCACTTGAA CGCTTGGTGT TTGATCTGCC TGTGCTGGAA 
AGTCAGATTG AGTTTGAGCT TGGCGCTTCT CAGAGCGCTG GCGATCTAAT TGATGCCAAT 
CCCGATTTTG TGGAGTTGGA TCGGGCTACG GATGGTGCTT TTGTGCGACT TCTCAATCAG 
GTCTTTAACG CTCCCCTGCC AGCGCAGATT GAGAAGGTGG TTGAGAAGTC TGTCGGGCAG 
CCTCTTTTGG AGCAGGCTCT GATCGCAGTA TCCAAGTTGG TTCAAGTTGA GGGGTTGCCC 
AAAGACACCA GTGGAAGGAT GTTGCTTGAG GCGCTTTCGC GTGCTTCCAA GAGTGGTCAG 
CCAACTGTGC TTGGTTTGTT GCGACAAATC CCTGGTCAAG CTGCATCCAT CAACTTGTCG 
AAATTGGCCA GCTATGTCTC ACGGCTACAA CGTAATCAGC TAGCAGCAAA TCTGCTTGTG 
GAGAAAGAGG CTTCTGTTCA GATTAAACCT GGATTACGCA TGCCGCTTAG CGGGTTGTGG 
TTAAGTCAGC AAGTTGATTT TCAGGCTTCC CATCGCTCTA AACCGATACG GGTGGTGGTG 
ATACAACCAA AGTCTCGCTC AAATGGTCGC TTGGTGGTCA TTTCACATGG GCTTTGGGAG 
TCTCCGAGAG ATCTTCAGGG TTGGGCTGAA TATCTTTCTG CTAACGGTTA TACGGTGTTG 
CTGCCGGAGC ATCAGGGCAG TGATGCTGAT CAGCAGAAGG CGATGTTGGC GGGGGATCAA 
CCTCCACCGG GACCTCAAGA GTTGCGTCTT CGTGCGATGG ATGTGACTGC GATGCTCTCT 
GCTGTTGAGT CAGGTGGTTT GTTGTCAAGA CTTTCCCTCA ATACAGATGA GGTCGCTGTT 
GTTGGTCATT CATGGGGGGC GACTACAGCG ATTCAATTGG CTGGGGCACG CTCAACGGAT 
GTGAAGCTCT CTGCTCGTTG TCATAACCAG GATGACCCTG AGCGCAATAT CAGCTGGATA 
CTGCAGTGCA GTTGGCTTTC CAAAATCAAT GAGTCTTCTT TTGAAGACTC ACGGGTCAAG 
GCAGTTGTGG CGGTGAGTCC GCCGTTACGT CTTCTATTTG ATCCCAGCAG AACTTCAGTT 
TTGACGGCCA AGGTTTTGTT GGTTAGTGGC ACTCGTGATT GGGTGGTTCC TCCCGTGCCT 
GAGGCTCTGA TGCCCATGCG TGATAGTGGT GCTTTGGAGT TTGGCCATCG CTTGGTGCTT 
GCCCAAGATG GTGGTCACTT CAACTTGATG GCACCTGCAA ATCAGCCTCA GCCGGCGATT 
TTGGCGCCCC TCATTCTTGC TTGGATTAAT GAACAGCTTG CAAATCCTGG TGTTGTCACC 
TTCAGTGGCG GCGGTTGGGG TGATGCCGTG CATCCTTTAG TGGATGTGAC TGATGCGGCT 
CTGAATTTGT ATCGCTGA

Protein sequence

MMFFRSRLWL LAISFGAGLG LVPSSAPALE RLVFDLPVLE SQIEFELGAS QSAGDLIDAN 
PDFVELDRAT DGAFVRLLNQ VFNAPLPAQI EKVVEKSVGQ PLLEQALIAV SKLVQVEGLP 
KDTSGRMLLE ALSRASKSGQ PTVLGLLRQI PGQAASINLS KLASYVSRLQ RNQLAANLLV 
EKEASVQIKP GLRMPLSGLW LSQQVDFQAS HRSKPIRVVV IQPKSRSNGR LVVISHGLWE 
SPRDLQGWAE YLSANGYTVL LPEHQGSDAD QQKAMLAGDQ PPPGPQELRL RAMDVTAMLS 
AVESGGLLSR LSLNTDEVAV VGHSWGATTA IQLAGARSTD VKLSARCHNQ DDPERNISWI 
LQCSWLSKIN ESSFEDSRVK AVVAVSPPLR LLFDPSRTSV LTAKVLLVSG TRDWVVPPVP 
EALMPMRDSG ALEFGHRLVL AQDGGHFNLM APANQPQPAI LAPLILAWIN EQLANPGVVT 
FSGGGWGDAV HPLVDVTDAA LNLYR