Gene Sala_1330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1330
Symbol
ID	4081001
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	1392648
End bp	1393679
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	63%
IMG OID	638009693
Product	transketolase, central region
Protein accession	YP_616377
Protein GI	103486816
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0296032
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.157339
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCG AAACCCGGAC GAAAACCATG AACATGATCG AGGCGATCAA CAGCGCCATG 
GACGTCATGC TCGAACGCGA TCCCGCGACC GTCGTGATGG GCGAGGACGT CGGCTATTTC 
GGCGGCGTTT TCCGCGCCAC CGCGGGCCTC CAGAAAAAGC ATGGCAAGAC GCGCGTGTTC 
GACACGCCGA TCAACGAATG CGGCATCATC GGCGTCGCGG TCGGCATGGG CGCCTATGGT 
CTGCGCCCCG TCCCCGAAAT CCAGTTCGCC GATTATATCT ATCCGGGGCT CGACCAGCTC 
GTCAGCGAGG CGGCGCGCCT GCGCTATCGC TCGGCGAACG ACTATATATG CCCGATGACG 
GTGCGCACAC CGTTCGGCGG CGGGATTTTC GGCGGCCAGA CGCACAGCCA GTCGCCCGAA 
AGCATCATGA CGCATATCTG CGGCGTCAAG ACGGTGATCC CGTCGAACCC CTATGATGCC 
AAGGGGCTGC TGATCGCGGC GATCGAGGAT AACGACCCCG TCGTCTTCCT CGAACCCAAG 
CGCATCTATA ACGGCCCGTT CAGCGGCTAT TACGATCGCC CGGTCGAACC CTGGTCGAAG 
CATGACGCCA GTGCGGTGCC CGAGGGCTAT TACCGCATCG ACCTGGGGAA AGCGGCGACG 
GTGCGCGAGG GCGAAGCGGT GACCGTACTC GCCTATGGCA CAATGGTTCA TGTCGCAAAG 
ACGATCATCG AGGAAATGGG GATCGACGCC GAAATCCTCG ACCTGCGCAC GCTGTTGCCG 
CTCGACATAG CGGCGATCGA GGCGTCGGTG AAAAAGACCG GCCGCTGCCT GATCATCCAC 
GAAGCGACGC GCACGTCGGG TTTTGGCGCC GAACTCGCCG CGCTGGTGCA GGAACGCTGC 
TTCTATCATC TCGAGGCGCC CGTCGAGCGC GTCACCGGTT TCGACACGCC CTATCCGCAC 
AGCCTGGAAT GGGCCTATTT CCCCGGCCCG GTGCGCATTG CGACCGCGCT GACCAAGATT 
TTGAAGGACT GA

Protein sequence

MSAETRTKTM NMIEAINSAM DVMLERDPAT VVMGEDVGYF GGVFRATAGL QKKHGKTRVF 
DTPINECGII GVAVGMGAYG LRPVPEIQFA DYIYPGLDQL VSEAARLRYR SANDYICPMT 
VRTPFGGGIF GGQTHSQSPE SIMTHICGVK TVIPSNPYDA KGLLIAAIED NDPVVFLEPK 
RIYNGPFSGY YDRPVEPWSK HDASAVPEGY YRIDLGKAAT VREGEAVTVL AYGTMVHVAK 
TIIEEMGIDA EILDLRTLLP LDIAAIEASV KKTGRCLIIH EATRTSGFGA ELAALVQERC 
FYHLEAPVER VTGFDTPYPH SLEWAYFPGP VRIATALTKI LKD