Gene A9601_00221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_00221
Symbol	gap2
ID	4716704
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	24082
End bp	25104
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	37%
IMG OID	640077719
Product	glyceraldehyde 3-phosphate dehydrogenase(NADP+)(phosphorylating)
Protein accession	YP_001008417
Protein GI	123967559
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0664623
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTTTGC GTGTTGCAAT TAACGGCTTT GGCAGAATTG GTCGAAACTT TATGCGTTGT 
TGGCTTAGTA GAGGGGCTTA CACCAATATT GAGGTAGTTG GGATTAATGT TACCTCTGAT 
CCTAAGACTA ATGCTCATTT ATTGAAATAT GACTCAGTCC TTGGTCAACT GGATGGTGTT 
GATATTCAAT ACACTGACGA TACTTTTGTA ATTAATAACA AGACAATTAA ATGTTTCTCT 
GATAGAAACC CTATGAACCT CCCTTGGAAA GAATGGGGTG TAGATTTGGT TATTGAATCT 
ACTGGAGTAT TTAATACAGA CGTAGGTGCA AGTAAGCACT TAGAGGTAGG AGCAAAAAAA 
GTAATCTTAA CTGCTCCCGG TAAAGGCGAT GGTGTTGGTA CTTATGTAGT TGGAGTTAAT 
GCTGATACAT ATAAACATAA AGATTATGAT ATTTTGAGTA ATGCTAGTTG TACAACGAAC 
TGTTTAGCTC CAGTAGTTAA AGTTTTAGAC CAAACTTTTG GGATTAATAA AGGTTTGATG 
ACTACAATTC ATAGTTATAC AGGGGATCAA AGAATTTTAG ATAATAGTCA TAGAGATCTA 
AGAAGGGCTA GAGCCGCAGC TACAAACATT GTTCCTACTT CTACAGGAGC TGCAAAAGCA 
GTAGCTCTGG TATACCCAGA AATGAAAGGC AAATTAACAG GAATTGCAAT GAGAGTTCCA 
ACTCCTAATG TTTCAGCAGT AGATTTTGTT TTTGAATCTT CTAAATCTGT CACAGCTGAA 
GAAGTCAACA CTGCTCTCAA GGAAGCATCT TTAGGCTCAA TGAAAGGAAT TATTAAGTAT 
GGAGATGAAC CATTAGTTTC AAGCGATTAT GCAGGTACCA ATGAATCATC AATTGTAGAT 
AGCGACCTCA CTATGTGTAT CGGCGACAAT CTTGTTAAGG TCCTTGCTTG GTATGACAAC 
GAGTGGGGCT ATAGTCAAAG GGTTGTTGAT TTAGCAGAGA TTGTTGCTAA AAATTGGGAA 
TAA

Protein sequence

MTLRVAINGF GRIGRNFMRC WLSRGAYTNI EVVGINVTSD PKTNAHLLKY DSVLGQLDGV 
DIQYTDDTFV INNKTIKCFS DRNPMNLPWK EWGVDLVIES TGVFNTDVGA SKHLEVGAKK 
VILTAPGKGD GVGTYVVGVN ADTYKHKDYD ILSNASCTTN CLAPVVKVLD QTFGINKGLM 
TTIHSYTGDQ RILDNSHRDL RRARAAATNI VPTSTGAAKA VALVYPEMKG KLTGIAMRVP 
TPNVSAVDFV FESSKSVTAE EVNTALKEAS LGSMKGIIKY GDEPLVSSDY AGTNESSIVD 
SDLTMCIGDN LVKVLAWYDN EWGYSQRVVD LAEIVAKNWE