Gene Swit_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Swit_1039
Symbol
ID	5198245
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingomonas wittichii RW1
Kingdom	Bacteria
Replicon accession	NC_009511
Strand	-
Start bp	1156725
End bp	1157699
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	71%
IMG OID	640580584
Product	transketolase, central region
Protein accession	YP_001261543
Protein GI	148553961
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.0489701
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0714055
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGG CGCGCTTCGC CCATGCGATC AACCGCGCGC TCGACGATGC GCTCGCGGCC 
GATCCCTCGG TGCTGCTGCT CGGCGAGGAC ATCGCCAATG CCGGCGGCAC CTTCGCGGTC 
ACGCGCGGCC TGCTCGACAA GCATGGGCCC GACCGGGTGA TCGACATGCC GATCGCCGAG 
AATGCGATCG CCGGCATGGC GGTCGGCCTC GCGCTCGGCG GCTTCCGGCC GGTCGTCGAG 
ATCATGTTCA TGGACTTCAT GACCCTGACC ATGGACGCGC TGGTCAACCA GGCGGCCAAG 
CTCCACTTCA TGTTCGGCGG GCAGAGCGCG GTGCCGATGG TGGTGCGCAC CCAGCATGGC 
GGCGGCCTCA ACGCCGGGCC GCAGCATTCG CAATGCCTGG AGGCGTGGTT CGCGCATATC 
CCGGGCCTGA AGGTCGTCGT GCCCGCGACG CTCGACGACG CCTATGCGCT GCTGCGCAGC 
GCGATCGACG ATCCCAACCC GGTCCTGTTC GTCGAGAACA AGGCGCTCTA CCCGATGAAG 
GGCGCGCTGT CCGACGCGCC GCCCGCCGCC CCGATCGGCA AGGCGCGGAT CGCGCGGGCC 
GGCAGCGACG TGACGATCGT CAGCTATGGC GCGATGGTCC ATCAGGCGAT GGCCGCCGCC 
GAGCAACTGG CGGGCGAGGG CGTCTCGGCC GAGGTGATCG ACCTGCGCAC CGTCCAGCCC 
TGGGACGAGG CGGCGGTGCT GGCGTCGCTG GCGAAGACCC ACCGGCTGGT GATCGCCCAT 
GAGGCGGTCG AGGCGTTCGG CGTCGGCGCG GAGATCGCGG CGCGGATGGC GCAGATCGGC 
TTCGACGAGC TGGACGGGCC GATCATGCGG GTCGGGGCGC CGTTCATGCC CGTGCCGTTC 
GGGCGCGGGC TGGAGGTCGA TTACATGCCC TCGGCGGCGC GGATCGTCGA AGCGGTGCGG 
GCGACCGATG TCTGA

Protein sequence

MSEARFAHAI NRALDDALAA DPSVLLLGED IANAGGTFAV TRGLLDKHGP DRVIDMPIAE 
NAIAGMAVGL ALGGFRPVVE IMFMDFMTLT MDALVNQAAK LHFMFGGQSA VPMVVRTQHG 
GGLNAGPQHS QCLEAWFAHI PGLKVVVPAT LDDAYALLRS AIDDPNPVLF VENKALYPMK 
GALSDAPPAA PIGKARIARA GSDVTIVSYG AMVHQAMAAA EQLAGEGVSA EVIDLRTVQP 
WDEAAVLASL AKTHRLVIAH EAVEAFGVGA EIAARMAQIG FDELDGPIMR VGAPFMPVPF 
GRGLEVDYMP SAARIVEAVR ATDV