Gene Sala_1935 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1935
Symbol
ID	4082884
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	2040111
End bp	2042204
Gene Length	2094 bp
Protein Length	697 aa
Translation table	11
GC content	66%
IMG OID	638010312
Product	malate synthase G
Protein accession	YP_616980
Protein GI	103487419
COG category	[C] Energy production and conversion
COG ID	[COG2225] Malate synthase
TIGRFAM ID	[TIGR01345] malate synthase G

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAT TTCTCGACCG CTCGGGCCTG TCCGTCGATT CGCGGCTGGC CGATTTCATC 
GAGCAGCGCG CGCTGCCCGG CACGGGGCTG GACGCCGCGC GCTTCTGGGC CGATTTCGCT 
GCTCTGCTGG GCCAGTTTGC GCCGGAAAAT ACGGAGCTGC TGGCGAAGCG CGAGGCGTTG 
CAGTCGCAGA TCGACGCCTG GCATCGGGCC CGCGAAGGCC AGCCGCACGA TCCCGCCGCT 
TATCAGCGCT TCCTGTCCGA GATCGGCTAT CTCGTCCCCG AACCCGAGCC GTTTGCGATC 
GGCACGGCGA ATGTCGATCC GGAAATCGCA ACAATGGCCG GGCCGCAGCT CGTCGTGCCC 
GCCCTCAACG CACGCTTTGC CCTGAACGCC GCCAACGCGC GCTGGGGCAG CCTCTATGAC 
GCGCTTTACG GTACCGACGC ACTCGACGCG CCGCCTGCGA AGCCCGGCGG CTATGATGCG 
GAACGCGGCG CGGCGGTGAT CGCGCGCGCC AAGGCCTTTC TGGACGACGC GGTGCCGCTG 
GCGTCGGGTC GCTGGGCCGA CTGGCAGGGC GGACAGCTTT TGCTTGCCGA TCCGTCGCAA 
TGGGTCGGCA GCAGAACCGG CGGTATTCTG CTCCGCCACA ATGGCCTGCA CATCGAGCTG 
GTGATCGACC CCGACGGCGC GATCGGCAAG ACCGACCCGG CGGGGATTTC CGATGTCATC 
CTCGAAGCCG CGCTGACCAC CATCATCGAC CTTGAGGACA GCGTCGCGGC GGTCGATGGC 
GAGGACAAGA CGCTCGGCTA TGCGAACTGG CTGGGGCTGA TGCGCGGCGA CCTCACCGAA 
AGTTTCGAAA AGGGCGGCAA GATCGTCACG CGCGCCATGG CGACCGACCG CGAATGGACG 
TCGCCCGACG GCGAGCCGTT CACGCTCCAC GGCCGCAGTG TGATGTTCGT GCGAAATGTC 
GGCCATCTGA TGACGACGCC GATGATCCGG CTGCCCGGTG GCGCCGAAGC GCCCGAAGGG 
CTGTGCGATG CGGTCATCAC CAGCCTGTGC TCGCTCCACG ATCTGAAGGG CCTCGGCGCC 
CTCAGGAACA GTCGCGCGGG CAGCATCTAT ATCGTCAAGC CCAAGCAGCA CGGGCCCGAG 
GAATGCGGCT TCACGAACCG GCTGTTCGAC GCGGTCGAGG ACATGCTGGG GCTGGCGCGC 
CACACGATCA AGGTCGGGGT GATGGACGAG GAACGTCGCA CCAGCGCGAA CCTTGCCGCC 
TGCATCCGCG CGGTGAAGGA CCGCATCGTC TTTATCAACA CCGGCTTTCT CGACCGCACC 
GGCGACGAGA TTCACACGTC GATGCGCGCG GGACCGATGA TTCCGAAGGG CGAGATGAAG 
GCGTCGGACT GGATCGCCGC CTATGAGGAT CGCAACGTCC GCATCGGGCT CGCCTGCGGC 
CTGTCGGGCA AGGCGCAGAT CGGCAAGGGC ATGTGGGCGA TGCCCGACAT GATGCGGGCG 
ATGCTCGAGG CGAAAATCGG CCACCCCAGA TCGGGCGCGA ACACCGCCTG GGTTCCCTCG 
CCGACCGCGG CGACGCTGCA TGCGCTGCAT TATCATATGG TCGATGTGTT TGCGCGGCAG 
AAGGAGATCG CGCGCGAGGC GGTGCCGTCG CTGGACCGCC TGCTCACCAT TCCCGTCGCC 
GTGGGGCGCA ATTGGAGCGA CGCCGAAATC GCGCGCGAAC TCGACAATAA TTGCCAGGGC 
ATATTGGGCT ATGTCGTACG CTGGATCGAC CAGGGCGTCG GCTGTTCCAA GGTGCCCGAC 
ATCGACGACG TCGGCCTGAT GGAGGATCGC GCGACGCTGC GGATCAGCAG CCAGGCGCTC 
GCCAACTGGC TCCTCCACGG CGTCTGCACG CCCGAACAGG TCGACGCCGC GCTGGCGCGG 
ATGGCGGCGA AGGTCGATGC CCAGAATGCG GGCGACCCGC TGTACGAAAA GCTGACGCCC 
GATAGCGTCG CGTATCGGGC AGCGCGCGCG CTGATCTTCG AAGGCGTGGC GCAGCCGTCG 
GGCTACACCG AACCGCTGCT GCACAAATAT CGGCAGATGA AGAAGGCGGG GTGA

Protein sequence

MTEFLDRSGL SVDSRLADFI EQRALPGTGL DAARFWADFA ALLGQFAPEN TELLAKREAL 
QSQIDAWHRA REGQPHDPAA YQRFLSEIGY LVPEPEPFAI GTANVDPEIA TMAGPQLVVP 
ALNARFALNA ANARWGSLYD ALYGTDALDA PPAKPGGYDA ERGAAVIARA KAFLDDAVPL 
ASGRWADWQG GQLLLADPSQ WVGSRTGGIL LRHNGLHIEL VIDPDGAIGK TDPAGISDVI 
LEAALTTIID LEDSVAAVDG EDKTLGYANW LGLMRGDLTE SFEKGGKIVT RAMATDREWT 
SPDGEPFTLH GRSVMFVRNV GHLMTTPMIR LPGGAEAPEG LCDAVITSLC SLHDLKGLGA 
LRNSRAGSIY IVKPKQHGPE ECGFTNRLFD AVEDMLGLAR HTIKVGVMDE ERRTSANLAA 
CIRAVKDRIV FINTGFLDRT GDEIHTSMRA GPMIPKGEMK ASDWIAAYED RNVRIGLACG 
LSGKAQIGKG MWAMPDMMRA MLEAKIGHPR SGANTAWVPS PTAATLHALH YHMVDVFARQ 
KEIAREAVPS LDRLLTIPVA VGRNWSDAEI ARELDNNCQG ILGYVVRWID QGVGCSKVPD 
IDDVGLMEDR ATLRISSQAL ANWLLHGVCT PEQVDAALAR MAAKVDAQNA GDPLYEKLTP 
DSVAYRAARA LIFEGVAQPS GYTEPLLHKY RQMKKAG