Gene A9601_03571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_03571
Symbol
ID	4717051
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	330130
End bp	331521
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	29%
IMG OID	640078066
Product	putative aldehyde dehydrogenase
Protein accession	YP_001008752
Protein GI	123967894
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATTT CTGATAAATT TCATTTAGAA GACATCTATA AATTAAAAAA TACAGTTCTC 
ACTGGTAAAA CTGAAGATAT AAAATGGCGG ATCCATCATA TCAATATAGT TTCTAAACTT 
TTAGATGAAA ATAAAAAAGA GATAATTAAA TCACTTTTTG TTGATCTCGG CAAATCTGAA 
ATTGAAGGGC TTTCAGAAAT CCTTTTAGTG AAAGAAGAAA TTTCACTTAT AAAAAAGAAA 
CTCAATTCTT GGATGCGACC AAAAAAGATT GATACCCCTT TTTATCTTTT TCCATCATCC 
TCCAAAGTTA TTTATGAACC TCTTGGGTGT GTCTTAATTC TTGGTCCTTA TAATTATCCA 
TTACTTTATA TTTTAAAGCC ATTGGTAAAT ATTTTCTCAG CAGGAAATAC AGCAGTTATA 
AAACCATCAG AGAAATGTCC TGCGACCTCA AAACTTATTA AAAAGCTTAC TTCCAAATAT 
TTCAGTAAAG ATGTCCTAAT GACAGTAGAG GGTGATAATA AACAATCCAT AAAATTAATT 
GAACAAAATT TTGACCACAT TTTTTTTACA GGAAGTACTA AAACTGGAAA ATCTATAATG 
AAATTAGCTG CAAAAAACTT AACTCCATTA ACTCTTGAGT TAAGCGGAAC AAATCCTGTA 
ATTGTTTTCA AGAATGCAAA TTTAGAAGTG GCTGCAAAAA GAATTGTTTG GGGTAAATTT 
TTTAATTCTG GTCAATCGTG CATGGCTCCG AATCATATCT TTGTAGATAA AGAAATTGAA 
AATATTTTTA TAGAAAAATT AAAGAAATAC ATAATAAGTT TTTACGGAGA TAATCCAATT 
ATTTCCGAAA ACCTATCAAA ATTGGAGAAA AAACAATTTA CATCAACTGT AGAAATTCTC 
AAACAATATG AAAAAGAAAA AAGAATTTTA TTTGGGGGGA CTTTTAGTAA AAAAAAGTTG 
AAAATATCTC CTACAATTTT GAGAACTAAA TTAAATGAAA AAGATATTTT GCAGAAAGAA 
TTATTCAGTT CACTACTTCC TGTAGTTGGA ATTAATGGTA TGGAATCAGC TTTAACACAG 
ATTAGTCTAA CATCAAAACC CTTAGCAATC TACTTATTTG GAGGCAATAA AAAAATCCAT 
AATCATATTT CAAAAGTAAC CAGCTCTGGA ACAATTTGTA TAAATGATGT GATGTTACCA 
GTCCTTATTC CAAATTTACC TTTTGGAGGC GTTGGGCAAA GTGGTATTGG CAAATTTCAT 
GGAGAAGAAG GCTTTCGAAA TTTTTCAAAT CAAAAATCTA TTACTTTTAA AGGTTTTTTA 
TTTGATTCAA ATCTGCGATA TCCCCCCTAT GAAAGAGTAA AGAAATTTTT AAAGTTTATT 
TTTCAGATTT AA

Protein sequence

MKISDKFHLE DIYKLKNTVL TGKTEDIKWR IHHINIVSKL LDENKKEIIK SLFVDLGKSE 
IEGLSEILLV KEEISLIKKK LNSWMRPKKI DTPFYLFPSS SKVIYEPLGC VLILGPYNYP 
LLYILKPLVN IFSAGNTAVI KPSEKCPATS KLIKKLTSKY FSKDVLMTVE GDNKQSIKLI 
EQNFDHIFFT GSTKTGKSIM KLAAKNLTPL TLELSGTNPV IVFKNANLEV AAKRIVWGKF 
FNSGQSCMAP NHIFVDKEIE NIFIEKLKKY IISFYGDNPI ISENLSKLEK KQFTSTVEIL 
KQYEKEKRIL FGGTFSKKKL KISPTILRTK LNEKDILQKE LFSSLLPVVG INGMESALTQ 
ISLTSKPLAI YLFGGNKKIH NHISKVTSSG TICINDVMLP VLIPNLPFGG VGQSGIGKFH 
GEEGFRNFSN QKSITFKGFL FDSNLRYPPY ERVKKFLKFI FQI