Gene Sala_1023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1023
Symbol
ID	4082306
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	1056342
End bp	1057610
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	68%
IMG OID	638009383
Product	extracellular solute-binding protein
Protein accession	YP_616073
Protein GI	103486512
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.705733
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGATTGA CCCGGCGCCA ATTGACAGGC GCACTCGCGG CGCTGCCCCT GCTCCCCATG 
CTCGGCGGCT GCGAGGAGCG GCACGCCGAC ACGCTGACCA TCTGGGCGAT GGGCAATGAA 
GGAGCGAGCC TCCCCGCCCT TCTCAACAGG CTTGCGTTGC CCGCGGACCT GCCACCGGTC 
GACGTGCAGC CACTGCCGTG GAGCGCAGCG CACGAAAAAC TGCTCACCGG CTTCGCGGGC 
GGCTCGCTGC CCACGATCGG CCAGGTCGGC AACAGCTGGA TCGCCGAGAT GGCGGCGATC 
GGCGCGATTG CTCCCCTGCC CGCTTCCGCC ACCACGCTGC TCGACGATCA GTTCGCCGCG 
GTCGTTGAAA CCAACCGGAT CGGCGGCACC GCCTGGGCCG TGCCCTGGTA TGTCGACACG 
CGGCTGCAAT TTTACCGCAA GGACATGTTC GCGCGTGCGG GTTATGCCGC GCCGCCGCTC 
GCATGGGCCG AATGGAAGCG CGCGCTGCAC CGCGTCAAGG CGCTCGCCGG ACCCGGCAAT 
TACGCCGTGC TGCTGCCGCT CAATGAGTTC GAGCAACTGC TGACCATCGC GCTGTCGGCG 
AGTGCGCGCC TGCTGCGCGA CAAGGGGGCG CGCGGCGCCT TTTCCGACCC CGAGTTCAAG 
GCTGCGCTCG CCTTCTATAA ATCGCTGTTC GACGAGCGGC TCGCGCCGAT CGCATCGGCG 
ACGCAGATTT CGAACATCTG GACCGAATTC GCCAAAGGCT ATTTCAGCAT TTTTACGTCG 
GGCCCATGGA CGATAGGTGA CATGAAAAGC CGCCTCGATC CCGCCATGCA GGACAAATGG 
GCGACCGCGC CCAATCCCGG TCCCGGCGGC ATCGGTTCGG CGGCGCCGGG CGGGTCGAGC 
CTCGTCGTTT TCGCCAGCCA GGCGGACAGC GCCGCCGCAT GGGATATCGT CGCGCGCCTG 
CTCGCGCCCA CCGCACAGCT CGCGTTTCAC CGGCTGACCG GCAATCTGCC CGCGCGGCGT 
TCGGTCTGGC GCGCCGCTGG CCTCGCGAGC GACCCCATCG TCGCCCCCTT CGCCACCCAG 
CTCGACCATG CGACCGCGTT GCCCAAAGTG CCCGAATGGG AACGCATCGT CACCGAAATG 
CAGGTGGTCG CCGAGCGCAT GGTGCGCGGC CACTATAGCG TCGATGCCGC CGCGCACGAG 
ATCGACCGCC GCGCCGACCG CCTGCTCGAA AAAAGGCGCT GGATGCTCGA CAGGGGGCGC 
GCCCTGTGA

Protein sequence

MRLTRRQLTG ALAALPLLPM LGGCEERHAD TLTIWAMGNE GASLPALLNR LALPADLPPV 
DVQPLPWSAA HEKLLTGFAG GSLPTIGQVG NSWIAEMAAI GAIAPLPASA TTLLDDQFAA 
VVETNRIGGT AWAVPWYVDT RLQFYRKDMF ARAGYAAPPL AWAEWKRALH RVKALAGPGN 
YAVLLPLNEF EQLLTIALSA SARLLRDKGA RGAFSDPEFK AALAFYKSLF DERLAPIASA 
TQISNIWTEF AKGYFSIFTS GPWTIGDMKS RLDPAMQDKW ATAPNPGPGG IGSAAPGGSS 
LVVFASQADS AAAWDIVARL LAPTAQLAFH RLTGNLPARR SVWRAAGLAS DPIVAPFATQ 
LDHATALPKV PEWERIVTEM QVVAERMVRG HYSVDAAAHE IDRRADRLLE KRRWMLDRGR 
AL