Gene Sala_0920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0920
Symbol
ID	4083130
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	932756
End bp	933811
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	63%
IMG OID	638009281
Product	LacI family transcription regulator
Protein accession	YP_615971
Protein GI	103486410
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.830745
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGAC GCCGCCAGGC GGTGACGATC AAGCATGTGG CGGCCGATGC CGGTGTGTCG 
CTGCAAACGG TCAGCCGTGT GATCAACGAC GAACCCAATG TGCGCTCGGC AATGAAGGCG 
CGCGTCCAGG CGTCCATCGA CAAGCTCGGC TATGTGCCGT CGATTGCCGC CCGCCGGATG 
AGCGGGTCGC GCTCTTATCT GATTCTGGCG ATCAACGATC GCGACCGGAC GATCGCGGAC 
TGGACGGCGC GGCAGGGCAC CGATTGGGTC GACCAGATGC TGCTGGGCGG CATGCTCAAG 
TGCGCCGAAT ATGGCTATCG GCTTATTTTT GAGCTTGTCG ACACGCACAG CGACCATGTC 
GAACGCGAAC TGCGCGCAAC CATCGCGGCG CTTCAGCCCG ACGGCGTGAT TCTGACGCCC 
CCCCATTCCG ACAATCCGCT GATCGTGCGA TTGCTTGAAC GGCAGCGAAT ACCCTTTGCG 
CGCATCGGAT CGCGCGGCGG AGGGGCGGGG ATTGCGCTGG TGATGGATGA CGAGAGCATG 
GCGCGCCACG CGACGCGTCA CCTCATCGAC CTTGGCCATC GGCGCATTGC TTTCATTGCA 
GGTTCAAGCG AATATCCGCT GAGCCAATGG CGCGTCGATG GTTGGGAAAG CGAAATGCGT 
GCCGCGGGAT TGCCGACCGC CGGACTCGTG GCGAGAGGCG ACTTCACTTA CGAATCGGGC 
GCGGCCGCCA CGCGGCAGCT TCTTGGTCAT CCGGATCGCC CTTCGGCGAT CATCGCCAGC 
AATGACCAGA TGGCGCTCGC CGCGCTCGAA GTCGCGCGCG AACTGGGGAT CGAGATTCCG 
TCACAGCTTT CGCTCGTAAG TTTCGACAAT ACGCCGATCG TGCGTTTTAC CCAGCCGACG 
CTTACCGCCG TTGATCAGCC GGTCGCCGAA ACCGTGTCGC GCGCCGTCGA AATGATCATC 
AAGGCGCAGC GGGGGGAAAA GTTGCCGCCA CAACCCGTGA TTGTTGCCGG GGGCTTCGTC 
GAACGCGAAT CGACTTCTGC GCCCGCGCAT GGATGA

Protein sequence

MARRRQAVTI KHVAADAGVS LQTVSRVIND EPNVRSAMKA RVQASIDKLG YVPSIAARRM 
SGSRSYLILA INDRDRTIAD WTARQGTDWV DQMLLGGMLK CAEYGYRLIF ELVDTHSDHV 
ERELRATIAA LQPDGVILTP PHSDNPLIVR LLERQRIPFA RIGSRGGGAG IALVMDDESM 
ARHATRHLID LGHRRIAFIA GSSEYPLSQW RVDGWESEMR AAGLPTAGLV ARGDFTYESG 
AAATRQLLGH PDRPSAIIAS NDQMALAALE VARELGIEIP SQLSLVSFDN TPIVRFTQPT 
LTAVDQPVAE TVSRAVEMII KAQRGEKLPP QPVIVAGGFV ERESTSAPAH G