Gene Sala_0034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0034
Symbol
ID	4082221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	32993
End bp	33979
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	66%
IMG OID	638008394
Product	ArsR family transcriptional regulator
Protein accession	YP_615093
Protein GI	103485532
COG category	[H] Coenzyme transport and metabolism [K] Transcription
COG ID	[COG0640] Predicted transcriptional regulators [COG2226] Methylase involved in ubiquinone/menaquinone biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0629975
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGC TGATCGACAT TTGCCGGGCC TTGGCCGATC CGACCCGCTT GCGAGTCGTG 
GCCTTGCTGC GCGAGATGGA ACTGGCGATC GGCGAGTTGG CGGTGGTTCT GGACCAGAGC 
CAGCCGCGTG TTTCCCGCCA CGTCCGCATC CTGGTCGAAG CGGGGATCGT CGAGCGGCGC 
CGTGAGGGAA GCTGGGTATT CCTGCGCATC GTCGCGGATG GGCCGATCGC CGCAATCATC 
GCGCAAGCGG ACAAATGGCC TTTTTCTGCG CGCGAAATGC GCGTGATCGC GCATGATGCG 
CGTCGCCTTG CGGCGGTGCG CGCCGAACGC GCGGCAGCGG CCGCGCGATA TTTCGCCGAA 
CATGCTGCCG AATGGGATGC CATTCGCTCA CGCCATGTCG CCGAAAGCGA GGTCGAAGCG 
GCGATGCTGG CGATGATGCA CAACCGCCGC CTTGGCCACC TTCTCGACAT CGGGACGGGA 
ACCGGGCGGA TGGCAGAGAT TTTTGCTCCG ACCGCGCGCC GCATCACCGC CCTCGACCGC 
AGCCCCGAAA TGCTGCGGAT CGCCCGCGCC AAGCTCGAAA GACAGCCGGT GCCCGTCGAC 
CTGATCCAGG GCGATTTTCT GGAGTTGCCG GTGGGGGACG CGAGCGTCGA CAGCATCGTC 
ATTCATCAGG CGCTGCATTT TGCGCACGAA CCCGATCGCG TGATCGCGGA AGCGAGCCGG 
GTGCTGCGCG GCGGCGGCCA CCTGCTGATC GTCGATTTCG CGCCGCACGA GGATGAGGAA 
TTGCGCACGC TTGCCGCGCA CGCCCGCCTC GGCTTTTCGG ACGCGCAGAT CCGCGGCTGG 
TTCGCCTCGG CGGGCCTGCT GCTCGAAACC ACACAGACGC TCGAAGGCGG GAAGCTGGCC 
GTCAAGCTCT GGCTCGGACG TCGCCGGAGC GACCAGGATC AACCCCCCGT CAGCGACGGC 
GGACCGACGA AAAGGCTTGC TGCATGA

Protein sequence

MSELIDICRA LADPTRLRVV ALLREMELAI GELAVVLDQS QPRVSRHVRI LVEAGIVERR 
REGSWVFLRI VADGPIAAII AQADKWPFSA REMRVIAHDA RRLAAVRAER AAAAARYFAE 
HAAEWDAIRS RHVAESEVEA AMLAMMHNRR LGHLLDIGTG TGRMAEIFAP TARRITALDR 
SPEMLRIARA KLERQPVPVD LIQGDFLELP VGDASVDSIV IHQALHFAHE PDRVIAEASR 
VLRGGGHLLI VDFAPHEDEE LRTLAAHARL GFSDAQIRGW FASAGLLLET TQTLEGGKLA 
VKLWLGRRRS DQDQPPVSDG GPTKRLAA