Gene A9601_18201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_18201
Symbol	tktA
ID	4718557
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	1552173
End bp	1554179
Gene Length	2007 bp
Protein Length	668 aa
Translation table	11
GC content	38%
IMG OID	640079553
Product	transketolase
Protein accession	YP_001010210
Protein GI	123969352
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0021] Transketolase
TIGRFAM ID	[TIGR00232] transketolase, bacterial and yeast

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCGCTG CATCTGTTTC ATTAGAATCA CTTTGTGTAA ATAGTATAAG AATGCTTGCT 
GTAGATGCAG TAAATAAATC TAATAGTGGT CATCCTGGAT TGCCAATGGG ATGTGCACCT 
ATGGGTTATG CATTATGGCA AAACATACTT AATCACAACC CTAACAACCC TAAATGGTTC 
AATAGAGACC GTTTTGTTTT ATCAGCTGGT CATGGCTGTA TGCTGTTGTA TTCCTTGCTT 
CATTTGACAG GATATAAATC AGTTTCCATA GAAGATATTA AAGAATTTAG GCAATGGGGA 
TCAAAAACTC CTGGACATCC AGAAACATTC GAAACTGAAG GTGTTGAAGT TACAGCTGGG 
CCTCTTGGAG CAGGAATTTC AAATGCAGTT GGTTTAGCAA TAGCTGAAAC ACACTTAGCA 
GCTAAATTTA ATAAGCCTGA TTGCAATATT GTTGATCACT ATACTTACGT AATAATGGGT 
GATGGCTGTA ATCAAGAAGG TATCGCATCA GAGGCCTGCT CATTAGCTGG TCATCTTAAG 
CTTGGGAAAT TAATTGCACT TTATGACGAT AATCAAATTA CAATTGATGG ACGGACCGAC 
GTTTCTTTTA CTGAAGATGT CTTAAAAAGA TACGAAGCTT ATGGATGGCA TGTGCAACAT 
GTTGAAGATG GGAATCATGA TGTTAAAGGA ATCACCGAAG CTATCGAAAA AGCGAAATTA 
ATTACAGACA AGCCTTCAAT TATAAAAATT TCTACAACCA TAGGTTACGG TTCTCCAAAT 
AAATCAGATA CTGCTGGAAT TCATGGAGCA GCTGTCGGAG AAGAAGAAGC TGCATTAACT 
AGAGAGTTTC TAAACTGGGA ATATCCTCCT TTTAAAATAC CCGATGAAGT ATATACGCAT 
TTTAGAAAAT CAATAAACAA AGGTGAAAAT TTAGAGCAAG AATGGGATTC TAAATTTGAA 
GAATATCAAA AAAAATATCC CTCTGAAGGA GCCGAATTAA AAAGAATGTT AGAGGGTCAA 
TTACCTGAGA ATTGGGACTC AGACCTCCCC TCTTATTCGC CTAATGATAA AGGTTTAGCC 
ACAAGAAAGC ATTCACAAAT ATGTTTGGGT GCTCTAGGTC CTAACCTACC TGAATTAATT 
GGCGGATCAG CAGATTTAAC TCACTCTAAT TACACAGATA TAAAAGGAGA AACTGGATCA 
TTCCAGCCAC ATAGCCCTGA AAAAAGATAT TTACATTTTG GTGTACGAGA GCATGCAATG 
GCAGCTGTAC TTAATGGTAT TGCCTATCAC AATAGTGGTC TTATCCCTTA TGGTGGAACC 
TTCCTTGTTT TCGCCGATTA TATGAGGGGC TCAATGAGGC TTTCAGCACT TAGCGAATTA 
GGAGTAATCT ATGTCTTAAC ACATGATTCA ATTGGTGTAG GAGAAGATGG GCCAACACAT 
CAACCTATTG AGACTATCCC TTCTCTTCGC GCAATGCCTA ACATGCTAGT TTTCAGACCT 
GGAGATGGCA ACGAGACGAG TGGGGCTTAT AAGCTTGCTA TTCAAAATCG AAAAAGACCT 
TCTGCCCTTT GTTTAAGTAG ACAAGGTATG CCAAATCAAG AAAATACTTC GATAGACAAA 
GTTGCTCTAG GAGGATATGT AGTTTCCGAT TGTGAAGGAA CACCAGACTT AATATTTATT 
GGTACTGGAA GCGAACTGAA TCTTTGCATT GAAGCAAGTA AGGAACTTTC AAGCTTGGGT 
AAAAAAATTA GAGTTGTCTC TATGCCTTGT GTAGAACTTT TTGAAGAGCA AGAAGAATCT 
TATAAAGAAA GTGTTTTACC TAGTAGTGTG AAAAAGAGAG TTGTAGTAGA AGCAGCTCAT 
TCATTTGGTT GGCATAAATA TACAGGTTTT GATGGTCTTT GTATCACTAT GGATAGGTTT 
GGTGCATCAG CACCAGGTGG AGAATGTATG AAAAATTTTG GATTTACAGT AGAAAACGTA 
GTTAATAAGA CTAAGGAAAT TCTATAA

Protein sequence

MVAASVSLES LCVNSIRMLA VDAVNKSNSG HPGLPMGCAP MGYALWQNIL NHNPNNPKWF 
NRDRFVLSAG HGCMLLYSLL HLTGYKSVSI EDIKEFRQWG SKTPGHPETF ETEGVEVTAG 
PLGAGISNAV GLAIAETHLA AKFNKPDCNI VDHYTYVIMG DGCNQEGIAS EACSLAGHLK 
LGKLIALYDD NQITIDGRTD VSFTEDVLKR YEAYGWHVQH VEDGNHDVKG ITEAIEKAKL 
ITDKPSIIKI STTIGYGSPN KSDTAGIHGA AVGEEEAALT REFLNWEYPP FKIPDEVYTH 
FRKSINKGEN LEQEWDSKFE EYQKKYPSEG AELKRMLEGQ LPENWDSDLP SYSPNDKGLA 
TRKHSQICLG ALGPNLPELI GGSADLTHSN YTDIKGETGS FQPHSPEKRY LHFGVREHAM 
AAVLNGIAYH NSGLIPYGGT FLVFADYMRG SMRLSALSEL GVIYVLTHDS IGVGEDGPTH 
QPIETIPSLR AMPNMLVFRP GDGNETSGAY KLAIQNRKRP SALCLSRQGM PNQENTSIDK 
VALGGYVVSD CEGTPDLIFI GTGSELNLCI EASKELSSLG KKIRVVSMPC VELFEEQEES 
YKESVLPSSV KKRVVVEAAH SFGWHKYTGF DGLCITMDRF GASAPGGECM KNFGFTVENV 
VNKTKEIL