Gene A9601_11691 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_11691
Symbol
ID	4717882
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	982555
End bp	983766
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	33%
IMG OID	640078884
Product	putative lycopene beta cyclase
Protein accession	YP_001009560
Protein GI	123968702
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID	[TIGR01790] lycopene cyclase family protein

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.451912
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAATAC TTGATATTTT AATTTTAGGT TCCGGGCCTG CAGCACTGTG CTTAGCTTCA 
GAATTAGCCA AGCAAGATCT TAGTATAAAG GGAATATCAA CTAAATCTCC AAATGAAAAA 
TGGGAGAATA CATATGGAAT TTGGGCATCT GAATTAGAGG AATTAGGATT AGAGTCATTG 
TTATCTCATC GGTGGTGTAA AACAGTTAGT TTTTTTGGAA ACGGGGAAAA TAAAAAGGGA 
GATAATCCAA CAAAACATAA TTATGATTAT GGTTTAATAA ATCAAGAAGC TTTTCAAAAT 
GAACTTTTAA AAAAGTGCAA AGGGATTGAA TGGTTGAATG AAACGGCAAA AGATATTAAA 
GAGAAAAATA AAATATCTGA GGTTATTTGT TCTTCAGGAC TAAGAATAAA GGCGAGGTTA 
GTCATTGACG CAAGTGGTCA TAAGAGTAAT TTTGTAAAAA GACCCGTACA AAATGAAATC 
GCTCAACAAG CTGCATATGG AATTGTCGGT AAATTTTCAT CCCCACCAGT CAAAAAAGAA 
CAGTTTGTTT TAATGGATTT TCGTCCAAAT CATTTAAACA ATGAAGAAAA GTTATCATCA 
CCATCCTTTC TCTATGCAAT GGATCTTGGA AATGAAACTT TTTTTGTTGA GGAAACATCA 
TTAGCTAGTT ATCCTGCACT ATCCCAAGAT AATCTAAAAA AAAGACTTTT CAAAAGACTT 
AATAATAAGG GTATTGAGGT GAGTGAAGTT TTTCATGAAG AGAATTGCCT TTTTCCAATG 
AATTTACCCC TCCCATTTAA AAAACAATTT GTTCTTGGTT TTGGAGGTTC AGCAAGCATG 
GTGCATCCTG CATCAGGATA CATGATCGGA TCTTTATTAA GGAGAGCTCC ACTACTCGCA 
GAAAAATTGG CGATCTTTTT AAAAGAACCT AATCTAAGTT CTCTTGAACT AGCGACAAAA 
GGATGGGGGG TCCTTTGGCC TTACGAGTTA ACACAAAGGC ATAAACTTTA CCAATATGGT 
TTAAGAAGAT TGATGAGTTT TGACGAAAGT AAATTAAGAA GCTTTTTCTC AAATTTCTTT 
AAATTATCGA CCAATGAATG GGTAGGATTT CTTACTAATA CACTTCCTCT TCCAAAACTT 
ATTTATGTGA TGAGTAAAAT GTTTATAAAT TCACCTCTAA AGGTAAAACT AGGAATGCTT 
AAATTAAATT AG

Protein sequence

MEILDILILG SGPAALCLAS ELAKQDLSIK GISTKSPNEK WENTYGIWAS ELEELGLESL 
LSHRWCKTVS FFGNGENKKG DNPTKHNYDY GLINQEAFQN ELLKKCKGIE WLNETAKDIK 
EKNKISEVIC SSGLRIKARL VIDASGHKSN FVKRPVQNEI AQQAAYGIVG KFSSPPVKKE 
QFVLMDFRPN HLNNEEKLSS PSFLYAMDLG NETFFVEETS LASYPALSQD NLKKRLFKRL 
NNKGIEVSEV FHEENCLFPM NLPLPFKKQF VLGFGGSASM VHPASGYMIG SLLRRAPLLA 
EKLAIFLKEP NLSSLELATK GWGVLWPYEL TQRHKLYQYG LRRLMSFDES KLRSFFSNFF 
KLSTNEWVGF LTNTLPLPKL IYVMSKMFIN SPLKVKLGML KLN