Gene A9601_11521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_11521
Symbol
ID	4717865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	966978
End bp	968528
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	27%
IMG OID	640078867
Product	putative dienelactone hydrolase
Protein accession	YP_001009543
Protein GI	123968685
COG category	[R] General function prediction only
COG ID	[COG4188] Predicted dienelactone hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAATACA TTTTTATAAT TTTTTTTAGT TTTTGTGGTT TATTTTTTAA TAATGGTTTA 
AAGGCTGCTG AAAAGATAAA TATTAAGTTT GAAGAGATGG AAATCCCTCT TACTATAGAA 
CAATTATCAA AATTAGAAAA ATACAAAGAT AATTCAACAG AATTAATAGA TTGGTTAAAA 
AAAAATGGAT TTATAAGAGT TTTTGAATTA TCAAAGTTTT TAGAATTTCC AGTTTTCAAA 
GAAGATGGAT TAAATAGAGA AATATTAAGA AGTTGGATAG GGCGTAAAAT TCTTACAGAA 
TTAAGCAAAA GCATTAAAGT TCCAAATGAC AATAATGGAA CAGAAATATA TAACACTATA 
GAAAATTTAT TAGATCAAAA AAAACAAATT TCAACTTTAG ACATCATAAA GGCATTACCA 
TCAGAAGAAA TTTCACTGGA TATTGATAAT CTAATTTTAA TAATTTCATC TTGGAAAAAT 
GAATTATCAA TGCAACAAGA ACTGTTGTCC AAATTAAATC AACTTGAAAG AACTAAACAA 
AATGTCTCTA AAAATACTGA AAAAAAATCA ATTGAAGATC TAATAAAAAT TGAAAAAAAA 
ATTTATGCTC CTCACCGAGT GAAACCTTTT GAAATTGAAA TATGGAAAAG CAATAAAACA 
AATTCTGATA GAGAATTAAT AATATTTATG CCAGGACTTG GAGGAGAAAT TAATAATTTC 
AAATGGATAG GTAACGAATT AGCTAGAAGA GGCTGGCCAA TATTATTCAT AGATCATAGA 
GGAAGTAATT TAGAATCATT CATAGAAGTA CTCGATGGTA AGGAAACAAT ACCAGGAAGT 
GCAGACTTTT ACTTATATAG AATTAAAGAT TTAGATGCTG TATTGAAAGC TCATGAAAAT 
GGAGAATTTG ATTTACCTAA TAATTCTTAC ATTTTAATGG GGCATTCACT TGGTGCTTTA 
ATAGCACTTT TATATGAAGG CAAGAAACCT ACTGATCAAC TAGAGGAAAA ATGTGATTTG 
GCATTAAAAG ACTTTGCGGT TACAAATTTA TCAAAATTAC TTCAATGTCA GTTGAGTGAA 
ATACCATTCC CTAAGAACAA TAACACTAAT AAGGCCAGTG CCATAGTAGG CTTTAATTCA 
TTTGGAAGTC TAGTATGGCC AAAAGAAAAT AGTACAGGCA TTAAGGTACC AACTCTTCTA 
ATAGGAGGTA CTTATGACCT TATTACACCG TTAATGAATG AACAATTTAA AGTTTTTTAT 
GCTTTAGATA ATCCATCAAA TAGATTTCTA ATTATTGAAG GAGCAAGTCA TTTCTCTCCA 
ATAAGAATTA ATAAAAGCTA TGAAAAAAAT AATGACCTCT TCAAAATAAG TGAATCTTTT 
ATTGGTTCAG AGCCAATATT AGTACAAGAT TTATCTACTA AATTTATAGT TGAATTTTTA 
AAAAATATTA AAGACCAAAA GATCCCTAAT GTAGTTAAAA ACCAAAGAGA TTTGGGACTT 
GACTTCCATT TTTTAGATCT TGAAACGATA AAAGAAATTT CCGAAAATTA G

Protein sequence

MKYIFIIFFS FCGLFFNNGL KAAEKINIKF EEMEIPLTIE QLSKLEKYKD NSTELIDWLK 
KNGFIRVFEL SKFLEFPVFK EDGLNREILR SWIGRKILTE LSKSIKVPND NNGTEIYNTI 
ENLLDQKKQI STLDIIKALP SEEISLDIDN LILIISSWKN ELSMQQELLS KLNQLERTKQ 
NVSKNTEKKS IEDLIKIEKK IYAPHRVKPF EIEIWKSNKT NSDRELIIFM PGLGGEINNF 
KWIGNELARR GWPILFIDHR GSNLESFIEV LDGKETIPGS ADFYLYRIKD LDAVLKAHEN 
GEFDLPNNSY ILMGHSLGAL IALLYEGKKP TDQLEEKCDL ALKDFAVTNL SKLLQCQLSE 
IPFPKNNNTN KASAIVGFNS FGSLVWPKEN STGIKVPTLL IGGTYDLITP LMNEQFKVFY 
ALDNPSNRFL IIEGASHFSP IRINKSYEKN NDLFKISESF IGSEPILVQD LSTKFIVEFL 
KNIKDQKIPN VVKNQRDLGL DFHFLDLETI KEISEN