Gene Sala_2094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2094
Symbol
ID	4080068
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	2200586
End bp	2201761
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	51%
IMG OID	638010469
Product	hypothetical protein
Protein accession	YP_617136
Protein GI	103487575
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.139728
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.387563
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATTG ACTCCGCACA TTATATTGGG CGTGAGCAAG CGCTCGTAAA GCACACATTT 
CTTGATCGAT ATCTTCCATC TCTAATTGGA AAAGTGTGCT CACGATACGA CGAGTTCGTC 
TATGTCGATG GCTTTGCCGG TCCTTGGCAA TCTGCCGCGG GAGAAAGCTT CGACGATACT 
TCATTTGGTA TCGCGCTTAC TCACATGACG GCGCAGCGCC TTCTATACCT CAGTAAAGGT 
CGAAATATAA GAATGCGAGC ATTCCTCGTG GAAAAGGACC CTAGCTCATT TGCGCAACTG 
GAACGCGCCA TAGCGCGGTT TCCAAAAATT GAGATTATTC CTTTAAATGG GTTGATGGAG 
GCGCATGCCG CAAGGATCGC TTCGTGCATT CCACAATCAG CGTTCTCCTT TACACTGATT 
GACCCCAAAG GATTTCCAGA TATCGGAGCA ATGCTCCCTC TTCTTAAGAG GGAACATGCA 
GAAGCACTCG TTAATTTCAT GTTCGATTTT GCTAATCGGT TTGCAGGTAC TGACCTTATA 
CCAGCGTTAG AAGATTGGCT TTCCGCATTG GGAAGCGTGG GTTGGCGCCA AGAGGTCGAG 
GGGCTCTCAG GCTCCGAGCG CGAACGGAAG CTAGAAAGAT TGGCTGCCGA AGCATTACAG 
ATTACCGGCG CTTACTCGTT TTCACCTGTT ATTACGGTGG ACAAAGTTCT TCATAATCGG 
CCGCTGTACA AGCTAATCTT TCTTTCAAGG CATGCCGAAG GCTTGAAGGT CTTCCGAGAC 
AGCGAGGCGA AAGCGCTGGA CACGCAAGCA ACGGCTCGGT CTGCATCAAA AGCAAAGAAG 
AGGGCCGAAA GCTCGCCAAT TGGAGATTTG TTTGCCGACG GGGAAGATGC GGTACCAAAT 
GATCGAAGCT CTCAGGTGAT CAGGCAAAGC CGGCAAGATG CCATTCGTGC CCTTGGAGCG 
CAAATAATGA CCGCCGGCTC AAGCGGAATG GTTTGGGGAA ACCTTTGGCC TCCTATCCTA 
GAGGATTTTT CCGTCACGCG ATCTTGGCTT GGCCACCAAG TGAATGACAT GCGTAAAGCG 
GGCCGGATTT TAGCACCGGG GTGGCCAAGC GAACGAAAGC AGATCCCCGA GGACAGCCAA 
CGCTTGATTT TGGCCCAAGC CGTCTCGCCC ACCTAG

Protein sequence

MAIDSAHYIG REQALVKHTF LDRYLPSLIG KVCSRYDEFV YVDGFAGPWQ SAAGESFDDT 
SFGIALTHMT AQRLLYLSKG RNIRMRAFLV EKDPSSFAQL ERAIARFPKI EIIPLNGLME 
AHAARIASCI PQSAFSFTLI DPKGFPDIGA MLPLLKREHA EALVNFMFDF ANRFAGTDLI 
PALEDWLSAL GSVGWRQEVE GLSGSERERK LERLAAEALQ ITGAYSFSPV ITVDKVLHNR 
PLYKLIFLSR HAEGLKVFRD SEAKALDTQA TARSASKAKK RAESSPIGDL FADGEDAVPN 
DRSSQVIRQS RQDAIRALGA QIMTAGSSGM VWGNLWPPIL EDFSVTRSWL GHQVNDMRKA 
GRILAPGWPS ERKQIPEDSQ RLILAQAVSP T