Gene Sala_3033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_3033
Symbol
ID	4083041
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	3180084
End bp	3181139
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	66%
IMG OID	638011419
Product	LacI family transcription regulator
Protein accession	YP_618070
Protein GI	103488509
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGCAC AGACCAGGGG GCCGGGGGGC AGGCAGCCGA CAATCAACGA CGTCGCCGCG 
CTTGCGGGTG TGTCCAAGAA AACGGTAAGC CGGGTCATCA ACCGGTCGGA GTTCCTGACC 
GAAAAGACGC GCGCCGCGGT GGAAAAGGCG ATCGAGCAAC TGGGGTTCGT CCCCAATCCG 
CAAGCGCGTG CGCTCGCCTT TCGCCGCAAC TTCCTGATCG CGCTGCTCCA CGACAATCCG 
AACGCACAGA CGGTGCTCAA TTTCCAGCGC GGCGTGCTCG ACGCGATCAA GGACAGCGAT 
CTGGCGCTGC TCGTCCGCCC GGTCGATCGC GGGTCGGACA AACTGCTCGA CGATGTGCGC 
ACCTTCCTCG AAAAACAGCG TCCGATTGGC GCGATGCTGT TGCCGCCGAT TTCGGAGAAT 
GACGAACTCG CGGCGCTTTG TGAGGATCTG GGCGTGCGTT ATGTGCGTAT CGGCTCGGCG 
CCGCTCGACG ATGCCAAACA TTGCATCTCG TCGAATGATC GTGAAGTGGT GGCGGCGGCG 
GTGCGCGGGC TGATTGCGCT GGGGCACCGC CGCATCGGCT TCGTGCGCGG CCCGGCCGGT 
TTCCGCTCCG CCGCCGAGCG CGAGAAGGGC TTTTTGGAGG CGCTCGCCGA AGCGGGGCTC 
ACGCTTCCGC CCGAGCTCAA TGCGCCGGGT AACTACCGCT ATGCCGCCGG AATCGAGGCG 
GGCGAGGCGC TGCTCGCGCG CGCCGATCCG CCGACGGCGA TCTTCTGCTC GAACGACGAA 
ATGGCGGCGG GGGTGCTGAG CGTCGCGCAT GGCAAGGGAA TCAAGGTGCC CGCCGAACTG 
TCGATCATCG GCTTCGACGA CAGCCCGACC GCAACGCATA TCTGGCCCGC GCTCAGCACG 
GTGCGCTGGC CGATCCGCGA AATGGGCGCG CGCGCCGCGC AGATCCTCGT TCCCGATTTT 
CTCGGCCCCG GCGCGAAGGT CGATGACGAA GACAATGTGC TGCCCTCAAC ATTGGTCGAG 
CGGCAGTCGG TCGCGCCCCC GCCCGACAGG CTCTGA

Protein sequence

MAAQTRGPGG RQPTINDVAA LAGVSKKTVS RVINRSEFLT EKTRAAVEKA IEQLGFVPNP 
QARALAFRRN FLIALLHDNP NAQTVLNFQR GVLDAIKDSD LALLVRPVDR GSDKLLDDVR 
TFLEKQRPIG AMLLPPISEN DELAALCEDL GVRYVRIGSA PLDDAKHCIS SNDREVVAAA 
VRGLIALGHR RIGFVRGPAG FRSAAEREKG FLEALAEAGL TLPPELNAPG NYRYAAGIEA 
GEALLARADP PTAIFCSNDE MAAGVLSVAH GKGIKVPAEL SIIGFDDSPT ATHIWPALST 
VRWPIREMGA RAAQILVPDF LGPGAKVDDE DNVLPSTLVE RQSVAPPPDR L