Gene Sala_1874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1874
Symbol
ID	4082619
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	1969871
End bp	1971496
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	71%
IMG OID	638010250
Product	sporulation related
Protein accession	YP_616919
Protein GI	103487358
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.138389
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.137004
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCAAG CGATATTGAC GGCGAAGCCG GCGCGCACAC GGCGTAACGT GGCAGCGCTG 
GGCGCGTTGT TGTTGGGGAC TCTCGGCATT CCGTCGGTGC ATGCGATGCA GGCGGCCGCG 
CCCGACGCGG CAACGCGCGC GGCGATGGAA AAGCGCAGCG CCGCGCGCGC GCTGCTTTCC 
GCGTCGCTGG CACGGCTGGC GTCGAACAAT AATGATGCGA CCGCGCTGCT CGACGCCGGG 
CGTGCGTCGA TCTCGCTCGA GGATTATCGC GCCGCCCTCG GCTTTCTGCT CCGCGCCGAA 
CAGGCCAGGC CGCGCGACGG CGCGGTCAAG GCGGCGCTCG GCTCGGCGAT GGTGCATTCC 
GAAAATCCGA CGCGCGCGCT CGACTATTTC GGCGAGGCGC AGCTTCTGGG CGCACCCGAA 
CGGCTGTTCC TCGCCGACCG CGGGCTCGCG CGCGACCTGC TCGGACAACA GGATGCGGCA 
CAGCGCGATT ATCAGCTCGC GCTGTCGATC GCGCCCGATG CCGAACTGAC CCGGCGTTAT 
GCCCTGTCGC TGGGGATCAG CGGCGACCCC GATCGCGCGA TCCAGCTGCT GACGCCGCAA 
TTGCGCGCGC AGGATCGCGG CGCGTGGCGG CTTCGCGCGA TGATCCTGGC GATGAACGGC 
CGCGACAGGG AGGCAAGCGA GATCGTCAAC GCGACGATGC CCGCGCCGAT GGCAGCCAAT 
ATCCTGCCCT ATCTGGTGCA GATGGACCGG CTCAATCCCG CGCAAAAGGC TGCCGCGGCA 
CATTTCGGTC GCTTTCCGAG CGGCCAGCCC GCCGCGGCGC AGCGGCCGGT TCAGGTGGCG 
ACCGCGACGC CGACGCCCCG GCCGGCGCCC GCTCCGCGCC GCAGCGCGCC GACCTCCACG 
CCCGCGGCCG CCGCTCCGGT CCCGAAGCCG CCGCCGCCGC CCGCCGCGAT GCCGCCCAGC 
CGCCCGCGCG CCGAAACGCC CGTGCCAGCC TCTTCCCCGC CCGCAAATCC CCCGACGTCG 
GCGGTGAAAG CGCCGGCGGG GCCGGGCTTC TCGATCGCCG ACATCGCGCC CGCACCGCCC 
GCCGCGGCCC CGGCGGCGCC GCGGCCCGCT GCGCAGGCAC CCGCCGCCGC GCCGCTCGCC 
TCGCTCGCCG ACATCGTTGG GTCGATCGAG ATACCCCCCG AGGAACTCGC GCGCCCCGAC 
GATGCGATCG GCGCCGAGAC GCTCGCCAAG CTGCTCGATG ACAAGCGCAA GGCCGAGGCT 
GCCGAAGCGG CAAAGCGCGA GAAGGAAGAA GCCGCCGCCA GGGCAAGGGC CGAGGCCGAC 
GCCAGGGCGA AAGAAGAAGC CGCGAAGAAA AAGGCGCATC CCGCGCGTAT CTGGGTGCAG 
ATCGCGACCG GCGCCAACCC GAAGGCGCTC GCTTTCGACT ATAACCGCTT CGCCAAGCGC 
AATGCGGCGC TGTTCAAGGG CAAGGCGGGC GCGACCGCCG AATGGGGTCA GACCCGGCGC 
CTGCTCGTCG GCCCGTTCGC GAACCGCAAG GCGGCGCAGG ACTGGCTCGC CGATTACAAA 
AAGGCCGAAG GCGACGGTTT TCTTTTCAGC TGCGAGGTCG GCGAGATCGT CGAACCGCTG 
CAGTGA

Protein sequence

MRQAILTAKP ARTRRNVAAL GALLLGTLGI PSVHAMQAAA PDAATRAAME KRSAARALLS 
ASLARLASNN NDATALLDAG RASISLEDYR AALGFLLRAE QARPRDGAVK AALGSAMVHS 
ENPTRALDYF GEAQLLGAPE RLFLADRGLA RDLLGQQDAA QRDYQLALSI APDAELTRRY 
ALSLGISGDP DRAIQLLTPQ LRAQDRGAWR LRAMILAMNG RDREASEIVN ATMPAPMAAN 
ILPYLVQMDR LNPAQKAAAA HFGRFPSGQP AAAQRPVQVA TATPTPRPAP APRRSAPTST 
PAAAAPVPKP PPPPAAMPPS RPRAETPVPA SSPPANPPTS AVKAPAGPGF SIADIAPAPP 
AAAPAAPRPA AQAPAAAPLA SLADIVGSIE IPPEELARPD DAIGAETLAK LLDDKRKAEA 
AEAAKREKEE AAARARAEAD ARAKEEAAKK KAHPARIWVQ IATGANPKAL AFDYNRFAKR 
NAALFKGKAG ATAEWGQTRR LLVGPFANRK AAQDWLADYK KAEGDGFLFS CEVGEIVEPL 
Q