Gene P9211_00231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_00231
Symbol	gap2
ID	5730606
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	+
Start bp	24834
End bp	25856
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	38%
IMG OID	641284365
Product	glyceraldehyde 3-phosphate dehydrogenase(NADP+)(phosphorylating)
Protein accession	YP_001549908
Protein GI	159902564
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.148459
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.106886
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTTAC GTGTAGCGAT TAATGGATTT GGCCGAATTG GTCGTAACTT CATGCGTTGT 
TGGTTGAGTC GAGGCTCTAA TACTGGCTTA GAAGTTGTTG GTGTCAATGT AACTTCTGAC 
CCTAAGACCA ATGCCCATTT GCTTAGATAT GACTCTATTC TTGGCGAACT CAAGGACACT 
GAAATTGGTT ATACAGATGA CAATTTTATA ATCAATGGAA AAGAGATCAA ATGCTTTTCT 
GATAGGAACC CTTTAAATTT GCCTTGGAAG GATTGGGGAG TAGATCTTGT AATTGAGTCA 
ACTGGTGTTT TTAATACTTA TGAAGGGGCC AGTAAGCATT TAGCTATAGG AGCTAAGAAA 
GTTATTCTTA CAGCTCCTGG TAAAGGTGAT GGCGTTGGTA CTTTCGTTGT TGGAGTGAAT 
GCAGATCAAT ATAATCATTC AGATTTTAAT GTTCTTAGTA ATGCGAGTTG TACGACGAAC 
TGTCTTGCAC CAGTAGTGAA GGTTTTAGAT CAAACTTTTG GAATTAACAA AGGTTTGATG 
ACTACAATCC ATAGTTATAC AGGTGATCAA AGAATTCTTG ATAATAGTCA CCGTGACCTT 
AGAAGAGCTA GAGCTGCAGC AATGAACATA GTGCCTACTT CCACTGGAGC AGCTAAAGCT 
GTGGCGTTAG TTTATCCGGA AATGAAGGGC AAGTTAACTG GAATTGCAAT GAGAGTTCCT 
ACTCCTAATG TTTCTGCAGT TGATATAGTT TTTGAAGCTG GTTGTTCAAT TACTGCAGAA 
GATATTAATG CTGCTATGAA AACTGCTTCT GAGGGGTCTA TGAAGGGAAT TATTAAATAT 
GGAGATCTTC CATTAGTCTC TAGTGATTAT GCCGGAACTA ATGAATCTTC TATTATTGAT 
ACTGATTTGA CTATGGCTAT TGGTAATAAC ATGGGCAAAG TAGTTGCTTG GTACGATAAT 
GAGTGGGGAT ATAGTCAAAG GGTTGTAGAT TTAGCAGAAA TTGTTGCTAA GAATTGGAAG 
TAA

Protein sequence

MTLRVAINGF GRIGRNFMRC WLSRGSNTGL EVVGVNVTSD PKTNAHLLRY DSILGELKDT 
EIGYTDDNFI INGKEIKCFS DRNPLNLPWK DWGVDLVIES TGVFNTYEGA SKHLAIGAKK 
VILTAPGKGD GVGTFVVGVN ADQYNHSDFN VLSNASCTTN CLAPVVKVLD QTFGINKGLM 
TTIHSYTGDQ RILDNSHRDL RRARAAAMNI VPTSTGAAKA VALVYPEMKG KLTGIAMRVP 
TPNVSAVDIV FEAGCSITAE DINAAMKTAS EGSMKGIIKY GDLPLVSSDY AGTNESSIID 
TDLTMAIGNN MGKVVAWYDN EWGYSQRVVD LAEIVAKNWK