Gene NATL1_11571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_11571
Symbol	gap3
ID	4780794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1033950
End bp	1034975
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	38%
IMG OID	640084436
Product	putative glyceraldehyde 3-phosphate dehydrogenase
Protein accession	YP_001014980
Protein GI	124025864
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0636891
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATTG GTATTAATGG TTTTGGCCGT ATAGGACGAC TTGTTCTTAG AGCACTCTGG 
GATAGGGAAA ATATCGAGAT TTCGCATATC AACGATCCAT TTGGTGATGC AAAGGGAGCT 
GCGCATTTAC TTGAATATGA CTCAGTTCAT GGTCGTTGGA ACAAAGCAAT AAGCAACGAC 
CAAAACAACC TGAGTATTGA AGGTCAGCCA ATATCTTTTT CTCAAGAAAG TGATTACACA 
AAAGTGCCAT GGAATGAAAA AGGTATAGAG CTAATTCTCG AATGCTCAGG AAAATTCAAA 
ACTCCTCAAA CATTAAATCC TTATTTTGAT ACTCTTGGGA TGAAAAGAGT TGTCGTTGCA 
TGTCCAGTAA AAGGATCCAT CCAGGGAGAG GATACTCTAA ATATCGTCTA CGGTATTAAT 
CATGATTTAT ATGAGCCCAA TAAACATCGC TTAGTAACAG CTGCATCCTG CACAACTAAT 
TGCTTAGCTC CCGTTGTGAA AGTTGTTAAT CAAGCTTTTG GTATAAAGCA TGGAAGCATC 
ACAACACTTC ATGATTTAAC AAATACACAG GTAATTGTTG ATTCATTTAA ATCAGATTTA 
AGAAGAGCAA GGAGCGGATC ACAAAGCTTA ATTCCAACAA CAACAGGATC AGCAAAAGCG 
ATAGGGATGA TATTCCCAGA ATTACAAGGA AAATTAAATG GCCATGCAGT TCGAGTCCCT 
CTCCTCAATG GATCTTTAAC TGATGCTGTA TTTGAATTAG AGAAAGAGGT CACGCAAGAA 
GAAGTTAATC ATGTGTTCAA AGAAGCTTCA GAAGGAGAGC TAAAAGGAAT CCTTGGTTAC 
GAAGAAAAAC CACTTGTCTC AATTGATTAT GTCAATGACT CAAGGAGTTC AATCATAGAT 
GCGCCATCAA CCATGGTGAT CAATAAATCT CAATTGAAAG TCTATATTTG GTATGACAAT 
GAATGGGGTT ATAGCTGTCG AATGGCAGAT CTCGTCTGCC ATGTCATAAA TCTTGAAAAG 
GATTAA

Protein sequence

MRIGINGFGR IGRLVLRALW DRENIEISHI NDPFGDAKGA AHLLEYDSVH GRWNKAISND 
QNNLSIEGQP ISFSQESDYT KVPWNEKGIE LILECSGKFK TPQTLNPYFD TLGMKRVVVA 
CPVKGSIQGE DTLNIVYGIN HDLYEPNKHR LVTAASCTTN CLAPVVKVVN QAFGIKHGSI 
TTLHDLTNTQ VIVDSFKSDL RRARSGSQSL IPTTTGSAKA IGMIFPELQG KLNGHAVRVP 
LLNGSLTDAV FELEKEVTQE EVNHVFKEAS EGELKGILGY EEKPLVSIDY VNDSRSSIID 
APSTMVINKS QLKVYIWYDN EWGYSCRMAD LVCHVINLEK D