Gene P9301_11701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_11701
Symbol
ID	4911953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	+
Start bp	981428
End bp	982639
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	33%
IMG OID	640160756
Product	putative lycopene beta cyclase
Protein accession	YP_001091394
Protein GI	126696508
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID	[TIGR01790] lycopene cyclase family protein

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAATAC TTGATATTTT AATTTTAGGT TCAGGTCCTG CAGCATTATG TTTAGCCTCA 
GAATTAGCAA AGCAGGATCT TAAAATTAAA GGAATATCAA CAAAATCTCC AAATCAAAAA 
TGGGAGAATA CATATGGTAT CTGGGCATCT GAATTAGAAG AATTAGGGTT AGAGAACTTG 
TTATCTCATC GATGGTGTAA AACAGTTAGT TTTTTTGGAG ATGGGGAAAA TAAAAAAGGG 
GATACTCCGA CAAAGCATAA CTACGATTAT GGTTTGATAA ATCAGGAAGC CTTTCAAAAT 
GAGCTTTTAA AAAAATGTAA AGGGATTGAA TGGTTGAATG AAACAGCAAC AGACATTAAA 
GAAAAAAATA AACTATCTGA GGTAATTTGT TTTTCAGGTC TCAAAATAAA GGCGAGATTA 
GTTATTGATG CAAGTGGTCA TAAAAGTAAT TTTGTAAAAA GACCAGTTCA AAATGAAATC 
GCTCAACAAG CTGCTTACGG AATTGTAGGT AAATTTACAT CACCACCTGT TAATAAAGAA 
CAATTTGTCC TAATGGATTT TCGTCCAAAT CATTTAAACA ATGAAGAAAA GTTATCATCT 
CCTTCCTTTC TTTATGCAAT GGATCTTGGC AACGAGACTT TTTTTGTTGA AGAAACTTCA 
TTAGCTAGTT ACCCTGCATT AACCCAAGAA AATCTTAAAA AAAGACTTTA TAAAAGACTT 
AAGAGCAAAG GTATTGAGGT AAGTGAAATT TTTCATGAAG AGAATTGCCT TTTCCCTATG 
AATTTACCCC TCCCATTTAA AAAACAATTT GTACTTGGTT TCGGAGGGGC TGCAAGTATG 
GTTCATCCTG CATCAGGATA CATGGTTGGA TCCTTATTAA GAAGGGCTCC ACTCCTTGCA 
CAAAAATTAG CACTCTTTTT AAAAGAACCT CATCTTAGTT CACTAGAGTT AGCTTCAAAA 
GGTTGGGAAA TCCTATGGCC TTACGAGTTA ACACAAAGGC ATAAACTTTA CCAATACGGT 
CTAAGAAGAT TGATGAGTTT TGACGAAAGT AGATTAAGAA GCTTTTTCTC AAATTTCTTT 
AGATTATCAA CCAATGAATG GGTAGGTTTT CTTACTAATA CACTTCCACT TCCAAAACTA 
ATTTACGTGA TGAGTAAGAT GTTTATAAAT TCACCCCTAA AAGTAAAACT AGGGATGCTC 
AAGTTAAATT AG

Protein sequence

MEILDILILG SGPAALCLAS ELAKQDLKIK GISTKSPNQK WENTYGIWAS ELEELGLENL 
LSHRWCKTVS FFGDGENKKG DTPTKHNYDY GLINQEAFQN ELLKKCKGIE WLNETATDIK 
EKNKLSEVIC FSGLKIKARL VIDASGHKSN FVKRPVQNEI AQQAAYGIVG KFTSPPVNKE 
QFVLMDFRPN HLNNEEKLSS PSFLYAMDLG NETFFVEETS LASYPALTQE NLKKRLYKRL 
KSKGIEVSEI FHEENCLFPM NLPLPFKKQF VLGFGGAASM VHPASGYMVG SLLRRAPLLA 
QKLALFLKEP HLSSLELASK GWEILWPYEL TQRHKLYQYG LRRLMSFDES RLRSFFSNFF 
RLSTNEWVGF LTNTLPLPKL IYVMSKMFIN SPLKVKLGML KLN