Gene Sala_1988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1988
Symbol
ID	4082153
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	2096682
End bp	2097803
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	66%
IMG OID	638010364
Product	OmpA/MotB
Protein accession	YP_617032
Protein GI	103487471
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2885] Outer membrane protein and related peptidoglycan-associated (lipo)proteins [COG3637] Opacity protein and related surface antigens
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000257198
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0360376
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGAAGC TTGCCGTCGC TGTGGCGTTG GCCTCCACCA CCCTCGCGTC GCCGTCCATG 
GCGCGCGACG ATTCCTGGTA TGTCGGTGTT GGCGCGGGCG CAATGCTCGT CGAAGACATT 
GATCTCGATA TCGGCACCTT CAACAATGCC GGGTCGCTCG ACCATCGCGC GGGCTATGAT 
TTCGAAGGCA CCGTCGGTTA TGACTTCGGC GGGTTCCGTG CCGAAGTCGA AGTCGGCTTC 
CGTGAAGCCG ACATCAAGTC GGGCCGTTTC GGCAACCCCG GCATCCCGCA GACGGCATCG 
GGCGCGGGTA CGCTGTTCAC CGGCTCGACC GACCTGAACG GCGATTCGAA CGCGCTCAGC 
TTCATGGTCA ACGGCATGCT CGACTTCGGC GACGACGACG GCCTGCAGGG CTTTGTCGGC 
GGTGGCGCCG GTGTCGCCCG CGTGTCGGTC GAACCCGTCT TTGCCGGTCC GTTCCTCGAC 
GATTCGGACA CGGGCTTTGC CTGGCAGGCG ATCGCGGGCG TCCGCGCGCC GCTCAGCAGC 
AACTGGGACG TCGGCCTGAA GTATCGCTTC TTCAACGCCG ACAATGTCGA TCTGGTGGAT 
CAGGCCGGTC GCGACGTTTC GACGCGCTTC CGCTCGCACT CGATCCTCGG CACGCTGACG 
TACAACTTCG GCGGCGCTCC GGAGCCGGTG GCGCCTCCGC CGCCGCCTCC GCCGCCCCCG 
CCGCCCCCGC CGCCCCCGCC GCCTCCGCCG CCGCCGCCGG TCGTGGAATG CGCGCCTGGG 
CCGTACATCG TGTATTTCGA CTGGGATCAG TCGAACATCA CGCCGGAAGC GGCTTCGACG 
CTCGACAATG CGATCAGCGC CTATAACCGT GGTTGCACGG GCACGCAGAT CATGCTCGCC 
GGTCACGCCG ACCGTTCGGG TTCGGCCCGC TACAACGTCG GCCTGTCGGA ACGCCGCAAC 
GATGCGGTTC GCAGCTATCT GACCGCTCGC GGTATCTCGG ATGGTTCGAT CAGCGCGCAG 
GCGTTCGGCG AAACCCGTCC GGCCGTTGCG ACCGCCGACG GCGTCCGCAA CGACCAGAAC 
CGTCGCGTGG AAATCACTTA CGGTCCGAAC TCGGGCATGT AA

Protein sequence

MRKLAVAVAL ASTTLASPSM ARDDSWYVGV GAGAMLVEDI DLDIGTFNNA GSLDHRAGYD 
FEGTVGYDFG GFRAEVEVGF READIKSGRF GNPGIPQTAS GAGTLFTGST DLNGDSNALS 
FMVNGMLDFG DDDGLQGFVG GGAGVARVSV EPVFAGPFLD DSDTGFAWQA IAGVRAPLSS 
NWDVGLKYRF FNADNVDLVD QAGRDVSTRF RSHSILGTLT YNFGGAPEPV APPPPPPPPP 
PPPPPPPPPP PPPVVECAPG PYIVYFDWDQ SNITPEAAST LDNAISAYNR GCTGTQIMLA 
GHADRSGSAR YNVGLSERRN DAVRSYLTAR GISDGSISAQ AFGETRPAVA TADGVRNDQN 
RRVEITYGPN SGM