Gene NATL1_00221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_00221
Symbol	gap2
ID	4780780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	24726
End bp	25748
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	39%
IMG OID	640083285
Product	glyceraldehyde 3-phosphate dehydrogenase(NADP+)(phosphorylating)
Protein accession	YP_001013851
Protein GI	124024735
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTTGC GTGTAGCGAT TAATGGATTC GGAAGAATTG GACGCAATTT TATGCGTTGT 
TGGCTCAGTA GGGGTGCAAA TACAAATATT GAGGTGGTCG GCATTAACGT CACTTCTGAT 
CCAAAAACTT GTGCACATTT GCTCAAATAT GACTCTATTT TAGGTGCTAT AAAAGACGCC 
CAAATTTCAC ATACGGACGA TACATTTCAA ATTAATGGCA AAACTATAAA ATGTTATTCA 
GATAGAAACC CTTTAAATCT TCCTTGGAAA GAGTGGGGAA TTGATTTAGT AATTGAGTCA 
ACTGGTGTAT TCAATACAGA TGTTGGTGCT AGTAAGCATC TACAAGTTGG TGCTAAGAAG 
GTCATTCTTA CTGCACCTGG GAAGGGTGAT GGTGTAGGTA CTTATGTGGT TGGTGTTAAC 
GCTGATTCAT ACTCACATGA AGATTTTGAT ATCCTTAGCA ACGCAAGTTG CACCACTAAT 
TGTTTAGCGC CAATCGTAAA AGTTTTAGAT CAAAAGTTGG GGATTAATAA AGGTTTAATG 
ACCACGATTC ATAGTTATAC GGGAGATCAA AGAATTCTTG ACAATGCTCA TCGTGATTTA 
CGTCGCGCAA GAGCAGCAGC AATGAATTTG GTCCCTACTT CAACTGGAGC GGCAAAGGCT 
GTTGCTCTTG TTTATCCACA AATGAAAGGG AAACTAACTG GTATTGCGAT GCGAGTCCCT 
ACTCCTAATG TTTCTGCGGT TGATTTGGTT TTTGAATCAG GACGTAAAAC TAGTGCTGAA 
GAGGTCAATT CATTACTTAA AACCGCTTCA CAGGGAGAAA TGAAAGGAAT CATTAAATAT 
GGTGATTTGC CTCTGGTTTC TACTGACTAT GCGGGAACGA ATGAATCAAC CATTGTTGAT 
GAAGCATTAA CAATGTGCAT CGATGACAAT ATGGTGAAAG TTTTAGCTTG GTATGACAAT 
GAGTGGGGTT ACAGTCAAAG GGTTGTTGAT TTGGCTGAAA TTGTTGCTCA GAAATGGAAG 
TAA

Protein sequence

MTLRVAINGF GRIGRNFMRC WLSRGANTNI EVVGINVTSD PKTCAHLLKY DSILGAIKDA 
QISHTDDTFQ INGKTIKCYS DRNPLNLPWK EWGIDLVIES TGVFNTDVGA SKHLQVGAKK 
VILTAPGKGD GVGTYVVGVN ADSYSHEDFD ILSNASCTTN CLAPIVKVLD QKLGINKGLM 
TTIHSYTGDQ RILDNAHRDL RRARAAAMNL VPTSTGAAKA VALVYPQMKG KLTGIAMRVP 
TPNVSAVDLV FESGRKTSAE EVNSLLKTAS QGEMKGIIKY GDLPLVSTDY AGTNESTIVD 
EALTMCIDDN MVKVLAWYDN EWGYSQRVVD LAEIVAQKWK