Gene P9301_12361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_12361
Symbol	gap3
ID	4911458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	+
Start bp	1048311
End bp	1049333
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	33%
IMG OID	640160825
Product	putative glyceraldehyde 3-phosphate dehydrogenase
Protein accession	YP_001091460
Protein GI	126696574
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.257201
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATTG GAATTAATGG TTTTGGAAGA ATTGGCAGAT TAGTTTTCAG AGCATTATGG 
GATAGAGCTG ATATAGAAAT AACTCATATA AATGAGATAG CAGGAGATTC GAATGCTGCT 
GCGCATTTAC TCGAATTCGA TTCAGTCCAT GGTAGATGGG TGAAAGATAT AAAGGTAAAA 
GAAGAAGAAA TAATAATTGA TGGAAAGAAA TTAACCTACA CATCTTTTAA AAATTACCTT 
GATATTCCTT GGGAAAAATC TTCTGTAGAT ATTATTTTGG AATGTACAGG AAAGAATAAA 
AAGCCAGACA AACTAAATCC CTATTTTGAT ACTCTTGGGA TGAAAAGAGT AATAGTAGCT 
TGTCCAGTCA AAGGAATTGT TGCAGAAGCT GAATCACTGA ATATTGTTTA CGGTATAAAT 
CAAAGTCTTT ATGACCCTAC CAAACATAAA TTAGTAACTG CAGCATCCTG CACTACAAAT 
TGTTTAGCTC CGATAGTAAA GGTAATTAAT GAAAATTTTT CTATTAAACA CGGTGCTATT 
ACAACTATTC ACGATGTAAC GAACACTCAA GTTCCTGTAG ATTTTTATAA AAGTGATCTG 
AGGAGAGCAA GAGGATGTAT GCAAAGTTTA ATACCTACTA CCACTGGATC TGCTAAAGCT 
ATCGCTGAGA TCTTTCCAGA ATTAAAAGGA AAATTAAATG GACATGCAGT AAGAGTTCCT 
CTACTTAATG GTTCTTTAAC AGATGCAGTT TTTGAATTAA ATAAAGAAGT GACAACTGAA 
CAAGTGAATA TGGCACTAAA GGAAGCTTCA GAAACTTATT TAAAAGGAAT TCTTGGCTAC 
GAAGAAAGAC CTTTAGTTTC TGCAGATTAT GTAAATGACT CTAGAAGTTC AATAGTTGAT 
AGTTTATCAA CGATGGTTGT TAATTCAAAT TTATTAAAGA TATACGCTTG GTATGACAAC 
GAGTGGGGTT ACAGCTGCAG ACTTGCAGAT CTTACTGAAT ATGTAATCAA AAAAGAGATT 
TAA

Protein sequence

MKIGINGFGR IGRLVFRALW DRADIEITHI NEIAGDSNAA AHLLEFDSVH GRWVKDIKVK 
EEEIIIDGKK LTYTSFKNYL DIPWEKSSVD IILECTGKNK KPDKLNPYFD TLGMKRVIVA 
CPVKGIVAEA ESLNIVYGIN QSLYDPTKHK LVTAASCTTN CLAPIVKVIN ENFSIKHGAI 
TTIHDVTNTQ VPVDFYKSDL RRARGCMQSL IPTTTGSAKA IAEIFPELKG KLNGHAVRVP 
LLNGSLTDAV FELNKEVTTE QVNMALKEAS ETYLKGILGY EERPLVSADY VNDSRSSIVD 
SLSTMVVNSN LLKIYAWYDN EWGYSCRLAD LTEYVIKKEI