Gene P9303_18391 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_18391
Symbol
ID	4775921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	1598749
End bp	1600392
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	56%
IMG OID	640087348
Product	acyl esterase
Protein accession	YP_001017846
Protein GI	124023539
COG category	[R] General function prediction only
COG ID	[COG2936] Predicted acyl esterases
TIGRFAM ID	[TIGR00976] putative hydrolase, CocE/NonD family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGCGTTG AAGGTCGAAC GAGCTCTGGA TCCGTGAACT GGCACGATGC CTGGCTGACA 
CTCTCTGACG GGGTCAAGCT CGTTGCCAGG TTATGGGTCC CGAAGGGTGA GGGACCCTGG 
CCTGCTCTCG TGATGCGTCA GCCCTACGGA CGTGCGCTCG CCTCAACGGT GACTTACATC 
CATCCTGGTT GGTGGGCAAG TCACGGCTAT CTGGTCGTGG TCCAGGACGT ACGTGGTCAA 
GGGGATTCCG AAGGCCACTT CAATGGCTTC CTGCAAGAAG CTTCTGATAC CAGTCAGACG 
CATGCATGGG TTCGGGAGTT GCCAGAATGC AATGGCCGTC TTGGAACCTA TGGGTTTTCC 
TATCAGGGCC TAACACAGCT GCTTGCCGAA CCCGGGACGC CGCCACCGGA CTGTCTGGCA 
CCAGCGATGG CAGGAGTTGA TGAGCGCAAC CATTGGAGTT GTGAGGGAGG TGCTCACTGG 
TGGCATCTTG GCTTGGCCTG GGGGCTGCAA CTTGCAGCAC TACAAGCTCG TCGCTGTGGC 
AACTGGGAAG CATGGAGAGA GCTTCGCCGC AGTTTGGAAG ACGACAGCTA CCTGTATGAG 
GGTCCGGCAC TTCTGAAACG CCACGATCCC GATGGAATGA GCTTGAGATG GCTACAACAA 
GCGAGCCAAA ACGATCAAGG CTGGGTTGTA CACAAGCCCT TGGATTCCTG GCTGCGTCAA 
CCGATGCTGC TTCTGGGTGG CTGGTGGGAC CCCCATTTGA ATGGCTTGCT TGATCTCTAT 
CAACGATCAA GCCAAGTAGG TGGTAGTCCA GAACTTCACA TCGGTCCAGC GACTCACCTG 
CAGTGGTGGC CTGATGCACA GCAACTTCAG CTGGAGTTCT TTGATCGCCA TCTGCAATCT 
TCGAAAGCCT TAACGAATTC AAGACCCCAT GGGCGGATCT GGAATATCAC GTCTTGTTCT 
TGGCAGAGAT TTGTAAGCCC CACCCAGACC ACAACATCAG CCCATGCCGG CTGGAGTCTT 
GTCAGTGGAG GGATGGCCTG CTTGGACCCC TCAGAAGGCG CCCTGCATCA GAACAAGGAA 
GGTGGCGGCG TGGTTTATGT GGTCCATGAC CCTTGGCGAC CGGTTCAAGC AGTGGGAGGA 
CATCTCAGCC CAAAACCAGG AGTTGCTGAG CGCAGCGCCG TGGACCAGCG CGCCGATGTG 
GCTACCTTCA CAAGCACTGC TTTGCAGGAA CCTCTCCAAC TCAATGGGAT CCCATTACTG 
CAGCTGACCG TGCAGTCAGA TCAACCGGGA TTTGACCTTT GCGTTGCCTT CTCCATTGTT 
AATCGCAGCC ACAGCGAGGT GAAGCAGCTC TCAACAGGTT TTCTGCGTGT GCAAGGAGAG 
CAGGCCCTGC GCATGCTGCC GCGCAAGGTG AAACTTCAAC CAATATTTGC AGACCTGCAG 
CGAGGAGAAC ATCTGCGCCT ATCTCTCGCA GGCGCTGCCT GGCCGGCCAT TGGTGTCAAC 
CCAGGCCACG ATCGTCATCC CTGTGGCCCT CCAGGACCCC ATTGCCAAGT GGTGACCATG 
ACACTGCAGC TCAATGGATC CAAGTTGAGG CTTTTGCCAT GGAACTCCGG CAAAATAGAT 
TTCGATTTGC CCCAAGAGTT TTGA

Protein sequence

MCVEGRTSSG SVNWHDAWLT LSDGVKLVAR LWVPKGEGPW PALVMRQPYG RALASTVTYI 
HPGWWASHGY LVVVQDVRGQ GDSEGHFNGF LQEASDTSQT HAWVRELPEC NGRLGTYGFS 
YQGLTQLLAE PGTPPPDCLA PAMAGVDERN HWSCEGGAHW WHLGLAWGLQ LAALQARRCG 
NWEAWRELRR SLEDDSYLYE GPALLKRHDP DGMSLRWLQQ ASQNDQGWVV HKPLDSWLRQ 
PMLLLGGWWD PHLNGLLDLY QRSSQVGGSP ELHIGPATHL QWWPDAQQLQ LEFFDRHLQS 
SKALTNSRPH GRIWNITSCS WQRFVSPTQT TTSAHAGWSL VSGGMACLDP SEGALHQNKE 
GGGVVYVVHD PWRPVQAVGG HLSPKPGVAE RSAVDQRADV ATFTSTALQE PLQLNGIPLL 
QLTVQSDQPG FDLCVAFSIV NRSHSEVKQL STGFLRVQGE QALRMLPRKV KLQPIFADLQ 
RGEHLRLSLA GAAWPAIGVN PGHDRHPCGP PGPHCQVVTM TLQLNGSKLR LLPWNSGKID 
FDLPQEF