Gene Strop_2098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_2098
Symbol
ID	5058561
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	2371774
End bp	2372778
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	71%
IMG OID	640474361
Product	transketolase, central region
Protein accession	YP_001158927
Protein GI	145594630
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0340316
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.234627
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAGCA TGACCATGGC TAAGGCGCTC AACACCGCGC TCGCCGACGC GATGCTCGAC 
GACGACCGGG TGGTCGTCTT CGGTGAGGAC GTCGGCCAAC TCGGCGGGGT CTTCCGGATC 
ACCGACGGGC TGGCGGCCCG CTTCGGCGAC AAGCGCTGCT TCGACACACC GCTCGCCGAG 
GCTGGCATCG TCGGTTTCGC GGTTGGCCTC GCCATGTCCG GGCTGCGGCC GGTGGTGGAG 
ATGCAGTTCG ACGCGTTTGG GTACCCGGCC TTCGAGCAGA TCGCCTCGCA CGTGGCGAAG 
CTGCGCAACC GCACCCGTGG CGCGCTGAGC GCGCCCATCG TCATCCGGAT CCCGTACGCG 
GGCGGCATCG GCGGGGTGGA GCACCACTGC GACTCCTCCG AGGCGTACTA CGCGCACACC 
CCCGGTCTGA AGGTCGTCAC CCCGGCCACC GTGACCGATG CCTACTCGCT GCTGCGTGCG 
GCGATCGACG ATCCGGACCC GGTCGTTTTC CTGGAGCCGA AGAAGCTCTA CTTCGCCAGC 
GCCGAGACGC AGTTGCCAGC TCGGACCGAG CCGTTCGGCC GCGCCGTCGT ACGCCGTCGG 
GGCACTGATG CCACCCTGGT CGCGTACGGG CCGGCGGTGC CGGTGGCCCT GGCAGCCGCC 
GAGGCGGCCC AGGAGGAGGG CTGGAACCTC GAAGTCGTTG ACGTGCGGAC GATCGTACCG 
TTCGACGACG GCACGATCGC GGCGTCGGTG CGAAAGACGG GCCGGTGCGT GGTGGTCCAG 
GAGGCCCAGG GCTTCGCCGG AGTCGGCGCG GAGATCGCCG CGCGGGTGCA GGAGCGTTGC 
TTCCACTCCC TACACGCGCC GGTGCTGCGG GTTGCCGGGC TGGACATCCC CTATCCGGCG 
CCGATGCTGG AGCACACCCA CCTGCCGTCG GTGGATCGGG TGCTCGACGC GGTGGCCCGC 
CTCCAGTGGG ACGACCAGCC CGACGAGCGA TGGGTGGCGG CCTGA

Protein sequence

MASMTMAKAL NTALADAMLD DDRVVVFGED VGQLGGVFRI TDGLAARFGD KRCFDTPLAE 
AGIVGFAVGL AMSGLRPVVE MQFDAFGYPA FEQIASHVAK LRNRTRGALS APIVIRIPYA 
GGIGGVEHHC DSSEAYYAHT PGLKVVTPAT VTDAYSLLRA AIDDPDPVVF LEPKKLYFAS 
AETQLPARTE PFGRAVVRRR GTDATLVAYG PAVPVALAAA EAAQEEGWNL EVVDVRTIVP 
FDDGTIAASV RKTGRCVVVQ EAQGFAGVGA EIAARVQERC FHSLHAPVLR VAGLDIPYPA 
PMLEHTHLPS VDRVLDAVAR LQWDDQPDER WVAA