Gene NATL1_20621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_20621
Symbol	tktA
ID	4780041
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1706093
End bp	1708105
Gene Length	2013 bp
Protein Length	670 aa
Translation table	11
GC content	41%
IMG OID	640085358
Product	transketolase
Protein accession	YP_001015882
Protein GI	124026767
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0021] Transketolase
TIGRFAM ID	[TIGR00232] transketolase, bacterial and yeast

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTGCCT TGACTACTTC CCTAGACACA CTTTGCATCA ACAGCATCAG GATGCTCGCT 
GTTGATGCAA TTAATAAATC CAAAAGTGGT CACCCAGGTT TACCTATGGG TTGCGCACCT 
ATGGGTTATG CATTATGGGA CAAGCACTTA CGACACAATC CAAAAAACCC GAAATGGTTT 
AATCGAGACA GATTTGTTCT TTCAGCGGGA CATGGATGCA TGCTTTTGTA TGCTCTCTTG 
CATTTGACTG GCTATGACTC TGTCACCATT GAAGATATAA AAGAATTTAG ACAGTGGGGA 
GCTAAAACTC CAGGGCATCC AGAAACCTTC GAAACTCCGG GAGTTGAAGT AACTGCAGGA 
CCTTTGGGAG CAGGAATTTC AAATGCAGTT GGATTAGCTA TTGCGGAAGC TCACCTTGCT 
GCAAAATTCA ACAAACCTGA TTCAACAGTT GTAGACCATT ACACCTATGT GATCATGGGG 
GATGGATGTA ATCAAGAAGG TATTTCCTCA GAAGCATGTT CTCTTGCTGG GCATTTAAAA 
CTTGGAAAAT TAATAGCTCT CTATGACGAT AATCACATAA CTATTGATGG AAGAACTGAT 
GTCTCATTTA CAGAGGATGT CTTAAAAAGA TATGAAGCAT ATGGATGGCA TGTACAAGAA 
ATTCCTGAGG GGAATACAGA TGTTGAAGGC ATATCTCAAG CAATCGAAAA GGCCAAATCA 
GTCACTGATA AGCCATCCAT CATCAAAGTA ACAACAACTA TCGGTTACGG TTCTCCAAAT 
AAAAGTGATA CTGCAGGTAT TCACGGCGCC CCATTGGGCG AAGAAGAGGC AGAGCTCACT 
AGAAAACAAT TAGGTTGGTC ATACAAACCT TTCGAGGTTC CCCAAGATGC TTATGATCAA 
TATCGACAAG CCATTCAAAA AGGTGCACAG CTAGAAGAAG AGTGGAATCA AAGCCTAGCT 
AAATACAAAG AAAAATATCC TAATGAAGCA ACTCAATTTG AGCGCATGTT GAGAGGTGAG 
CTCCCTGAAG GCTGGGATAA AGATTTACCT ACCTATACAT CCGATGATAA AGGGGTTGCT 
ACTAGAAAAC ATTCTCAAAT ATGTCTAGGT GCTCTTGGTC CAAACATCCC TGAACTAATA 
GGAGGTTCTG CTGATTTAAC TCATTCAAAC TACACAGATA TAAAAGGAGA AACTGGATCT 
TTTCAATATG AAAGTCCTGA AAAACGTTAT TTACATTTTG GTGTCAGAGA GCATGCTATG 
GCAGCCATAT TGAATGGCAT TGCTTATCAC GACAGTGGTT TAATTCCTTA TGGTGGAACC 
TTCTTAGTCT TCGCAGATTA CATGAGAGGA TCGATGCGTC TTTCTGCTCT TAGTGAGCTT 
GGAGTTATTT ATGTTTTAAC CCATGATTCC ATAGGTGTTG GTGAAGATGG CCCAACACAT 
CAACCTATAG AAACCATCCC ATCATTGAGA GCAATGCCAA ATATGATGGT TTTCCGTCCT 
GGCGATGGCA ATGAAACCAG TGGTGCTTAT AAAGTTGCAA TTAAAAATCG TAAGAGACCA 
AGTTCCTTAT GCCTAAGTAG GCAGGGTATG GCAAATCAAC AAAATTCATC CGTAGACAAA 
GTTGCTTTAG GTGGATATGT ACTTGAGGAG TGCGATGGCA CCCCAGAACT AATACTTATC 
GGAACCGGAA CTGAACTTGA TTTATGTGTT CAAGCAGCGA AAAAGTTAAC TAAGGAAGGT 
CGAAAAGTGC GTGTTGTTTC TATGCCATGC GTTGAACTTT TTGAAGAACA AAGCGATAGT 
TATAAAGAAG AAGTTTTGCC TTCAAATATC AGAAAACGCC TAGTAGTTGA AGCCGCAGAG 
AGTTTCGGAT GGCACAAATA TATTGGTCTT GATGGTGACA GCGTAACTAT GAATAGCTTT 
GGAGCATCTG CTCCAGGTGG ATTATGTATG GAAAAATTTG GATTTACAGT TGAAAACGTA 
CTAGAAAAAT CTAAAAGTCT GCTCAACAAA TAA

Protein sequence

MVALTTSLDT LCINSIRMLA VDAINKSKSG HPGLPMGCAP MGYALWDKHL RHNPKNPKWF 
NRDRFVLSAG HGCMLLYALL HLTGYDSVTI EDIKEFRQWG AKTPGHPETF ETPGVEVTAG 
PLGAGISNAV GLAIAEAHLA AKFNKPDSTV VDHYTYVIMG DGCNQEGISS EACSLAGHLK 
LGKLIALYDD NHITIDGRTD VSFTEDVLKR YEAYGWHVQE IPEGNTDVEG ISQAIEKAKS 
VTDKPSIIKV TTTIGYGSPN KSDTAGIHGA PLGEEEAELT RKQLGWSYKP FEVPQDAYDQ 
YRQAIQKGAQ LEEEWNQSLA KYKEKYPNEA TQFERMLRGE LPEGWDKDLP TYTSDDKGVA 
TRKHSQICLG ALGPNIPELI GGSADLTHSN YTDIKGETGS FQYESPEKRY LHFGVREHAM 
AAILNGIAYH DSGLIPYGGT FLVFADYMRG SMRLSALSEL GVIYVLTHDS IGVGEDGPTH 
QPIETIPSLR AMPNMMVFRP GDGNETSGAY KVAIKNRKRP SSLCLSRQGM ANQQNSSVDK 
VALGGYVLEE CDGTPELILI GTGTELDLCV QAAKKLTKEG RKVRVVSMPC VELFEEQSDS 
YKEEVLPSNI RKRLVVEAAE SFGWHKYIGL DGDSVTMNSF GASAPGGLCM EKFGFTVENV 
LEKSKSLLNK