Gene Sala_2758 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2758
Symbol
ID	4080243
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	2907047
End bp	2908087
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	68%
IMG OID	638011141
Product	periplasmic protein-like protein
Protein accession	YP_617796
Protein GI	103488235
COG category	[S] Function unknown
COG ID	[COG3672] Predicted periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.202545
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.860065
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCGTC ATGCCCCATC CGCCCGCGCC GCGCGGTCCC TGCTGCCGCT GATCGCGGCC 
ACCCTGGCGG TCGCGCCCGC AGCAGCGCAG GCGTCGACCA AGCTGGACAA TGTCAAGGCG 
GCGGCACCGG CCAAGGTCGT CTGTGACGCG GTGGCCGCTT CCGCCGTGCC GCGCGCCCGC 
GACCTGTCGC AGCTGATCCT GGACGGCGCG CCGAGCGCGC TCGATCGCAT CAGGATGCAG 
CAGCAAGGGA TAAATCGGCC CGCAACGGTC AACACCATCC CCGATCGTCG CGCGCTCGAA 
CCCGCAAGCC GTATGCCGCT TTCCTTCACG GCGTCGGCAC CCGTCGACTG CCGCAATGCG 
CCGTCGCCGC CGGGCGTGAC GGCCGAATGG GATGCCGGGT CCGAACTCGG CACGCGCGCC 
ATTCCGGTCA AGCGGACGCG CTTCGACGAT CGCTGGGACC GCGTGCACCG CGCCGCGCCC 
GCCGCGCTGA TGCAGCGCCA GCTGCAGAGC GCCAATGCCC TGTCCGGGCT CAGCGAAACC 
GAGCTGCTGG CGCGCGTCAA TCAATGGGTC AATCGCGAAA TCGCCTATGT CGGGGACGAT 
CGCAATTACC GCCGCCGTGA TTTCTGGGCG ACCGCTGACG AGACGCTCGC GCGCGGCAGC 
GGTGATTGCG AGGATTTTGC GATCCTGAAA ATGCAGATGC TGCGCGCCGC CGGGATCGAT 
GCCAACCGGA TGAAGCTCGT TCTGCTGCGC GATCTCGCCG CCAACGCCGA TCACGCCTTC 
CTGCTCGTCG ATACGGGTGG CGGCAAGCTG GTGCTCGATA ATGTGACCGA CCGCCTCTAT 
GACGGCGCCC GACCGCAAGC GGTGCGCCCC GTGCTGTCGT TCAGCGCCGA CCGGCGGTGG 
GTCCACGCCT ATCGCACCGC GGCGGAAACC CCGGCTGCAA CCATCGTTCC GGGGGCGCGC 
AAGAGCATCA CCCTTGCGCT CGCCGATCAG CGTTCGGTCA AGGCCGTCCC GCTGACCTTC 
AAAACGGGTT TGAGCAAATA G

Protein sequence

MRRHAPSARA ARSLLPLIAA TLAVAPAAAQ ASTKLDNVKA AAPAKVVCDA VAASAVPRAR 
DLSQLILDGA PSALDRIRMQ QQGINRPATV NTIPDRRALE PASRMPLSFT ASAPVDCRNA 
PSPPGVTAEW DAGSELGTRA IPVKRTRFDD RWDRVHRAAP AALMQRQLQS ANALSGLSET 
ELLARVNQWV NREIAYVGDD RNYRRRDFWA TADETLARGS GDCEDFAILK MQMLRAAGID 
ANRMKLVLLR DLAANADHAF LLVDTGGGKL VLDNVTDRLY DGARPQAVRP VLSFSADRRW 
VHAYRTAAET PAATIVPGAR KSITLALADQ RSVKAVPLTF KTGLSK