Gene Sala_2028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2028
Symbol
ID	4079926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	2139974
End bp	2141053
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	69%
IMG OID	638010404
Product	hypothetical protein
Protein accession	YP_617072
Protein GI	103487511
COG category	[S] Function unknown
COG ID	[COG4427] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0314361
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGC GTATCCAGCC CGCCGGAATC GGCGCCACCG GGAAAGGCGC TGTGCGCGCT 
GCCTTCGCAA ATCAAGTGGC CTATTGCCGC GCCAACGATG CCCCCATCAC CGCGCGTATC 
GTCGCCGCGA TCGCCAGCCT GCTGGACGAC CCCGCGAGCA ATTTTGCGCG CCGCATCGCC 
AACTGGCCGG GCGCGCCGCT CGCCGACGCG CTGCCGCTTC GCGCCGCGGG GGGCTTTCAC 
GCGCTGCACC TGTCGGAGGC TGCGCATGAA CTCGCCCCCA TTTATGCCGA CGCCGAGGAC 
ATCAACGACG CCGCGATCGT CGCAGGTGTG GTTGCACGGC ATGAAGCCGC GCTGCTCCCC 
TGGCTCGACG GCCCGCCGCA GACCAACGAG GCGGGGCGCT CGTCAAACTT CATCGCGGCG 
ATGCTGTGGC TCGCCGAACA GGGGTTGCCA GCGCATTTCG ACTGCCTTGA AATCGGATCG 
AGCGCGGGCA TCAATCTGAT GATCGACCGT TATCATTATG ACCTCGGCGG CGTGCATGTC 
GGGCCGCAGC CCGGCGCGAT GGCCTTCACC CCCGATTGGC GCGGCAACCA TCCGCCCATG 
CACGCAATCG CCATTGCCGG GCTCAGGGGC TGCGACGTTG CGCCGGTCGA TCTCACCGAC 
CCGGCGCAGG CGCTCCGCCT CAAAGCCTAT ATCTGGCCCG AACATGACGT CCGCTTCGCG 
CGCATGGAAG CGGCGATCGC CGCCGCGTAT GTGGAAAAGC CCTGTCTCAT CCGCGCCAAC 
GCCGCCGATT TCGTCGAGGC CGAGCTGGCA CGGCCACAGG CGGCGGGAAC GACGCGCGTG 
CTGATGCACT CGATCGTCTG GCAATATGTC CCCGCCGAGC AGCAGGCGCG CGTCACCGCC 
GCCATGGAAG TCGCGGGCGC CCGCGCCACC GCCGACCGCC CCGTCGCATG GATCGCGCTC 
GAAGCGAACC GGACCGTCCA CCATCACGAA CTGGTCGTGC GCTACTGGCC GGGCGGCGAC 
GTCCCCCGCA AGCTGGGCCA TGCCCACGCG CACGGCGCGT GGATCGAGTG GCTGGCGTAA

Protein sequence

MSERIQPAGI GATGKGAVRA AFANQVAYCR ANDAPITARI VAAIASLLDD PASNFARRIA 
NWPGAPLADA LPLRAAGGFH ALHLSEAAHE LAPIYADAED INDAAIVAGV VARHEAALLP 
WLDGPPQTNE AGRSSNFIAA MLWLAEQGLP AHFDCLEIGS SAGINLMIDR YHYDLGGVHV 
GPQPGAMAFT PDWRGNHPPM HAIAIAGLRG CDVAPVDLTD PAQALRLKAY IWPEHDVRFA 
RMEAAIAAAY VEKPCLIRAN AADFVEAELA RPQAAGTTRV LMHSIVWQYV PAEQQARVTA 
AMEVAGARAT ADRPVAWIAL EANRTVHHHE LVVRYWPGGD VPRKLGHAHA HGAWIEWLA