Gene Sala_2157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2157
Symbol
ID	4080191
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	2267982
End bp	2269139
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	66%
IMG OID	638010535
Product	glycosyl transferase, group 1
Protein accession	YP_617199
Protein GI	103487638
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.750957
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.801991
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGTTT CGGACCTTCG CATCGCCCTG TTCAGCGGCA ATTACAACAT GACGACCGAC 
GGCGCGAACA AGGCGCTCAA TCGCCTCGTC GGATATCTGC TGGCGCAGGG CGCGGCGGTG 
CGCGTCTATT CGCCGACCGT CGCCCACCCC GACTTCGAAC CCACCGGCGA CCTCGTCAGC 
GTGCCGTCGA TGGCGATCCC CGGGCGCAGC GAATATCGCA TACCCTTGAG CTTTTCATCG 
AGGGTGCGCC AGGACATCGC CACCTTTGCG CCCAACATCG TCCATATCTC CAGCCCCGAT 
CGCGTGGCGC GACAGGCGGC GGCGTGGGCG CGGCGGCGCC GGATTCCGGT GGCCTGTTCG 
GTCCATACGC GCTTCGAAAC CTATTTCCGC TATTATAATC TGTCGTTCCT CGAACCGCTC 
GTGGTCGCCT GGCTGCGCAA ACTCTATCGC CGCTGCGACG CGCTGATCGC GCCGTCCGAA 
AGCTTTGCGC AGGTGCTCCG CGACCAGCGG ATGAATTATG ACATCGGCAT CTGGACGCGC 
GGCGTCGAAC AGGGGATTTT TCACCCCGGC CGCCGCGACA TGGCCTGGCG CCGGTCGCTC 
GGCATCGCCG ACGACACGCC CACTATCGCC TTCCTCGGGC GGCTGGTGAT GGAAAAGGGG 
CTCGACGTCT TTGCCGATGC CATCGACGTG CTGACGCGCC GCGGCGTGCC GCATCAGGTG 
GTGGTGATCG GCGAGGGGCC GGCGGGCGAC TGGTTCGAAT CGCGCCTGCC CAACGCGCAT 
TTCGTGGGCT TTCAGGGCGG CGCCGATCTC GCTCATGCGC TTGCGTCGTG CGACATCTTC 
TTCAACCCGT CGGTCACCGA AACCTTTGGC AATGTCACGC TCGAGGCCAT GGCGTGCGGG 
CTGCCGGTGG TGGCGGCGCG CGCGACGGGC AGCGCGAGTA TCGTCAAGCA TGGCCAGACG 
GGCTATCTCG TCGCACCGGG ATCGATCTCG GGCTTTGCCG ACCATCTCGA GCGTTATTGC 
AACGATACCG CGCTGCGCGC CGACCATGGC GCCGCGGCGG TGCGCGAAAG CGGCGCCTAT 
CAGTGGGATG CGATCAATCA GGCGGTTGCC GACACCTATT TGCGCCTGAT CCGCCAGAAA 
CAGCGGCACG GGGGCTGA

Protein sequence

MDVSDLRIAL FSGNYNMTTD GANKALNRLV GYLLAQGAAV RVYSPTVAHP DFEPTGDLVS 
VPSMAIPGRS EYRIPLSFSS RVRQDIATFA PNIVHISSPD RVARQAAAWA RRRRIPVACS 
VHTRFETYFR YYNLSFLEPL VVAWLRKLYR RCDALIAPSE SFAQVLRDQR MNYDIGIWTR 
GVEQGIFHPG RRDMAWRRSL GIADDTPTIA FLGRLVMEKG LDVFADAIDV LTRRGVPHQV 
VVIGEGPAGD WFESRLPNAH FVGFQGGADL AHALASCDIF FNPSVTETFG NVTLEAMACG 
LPVVAARATG SASIVKHGQT GYLVAPGSIS GFADHLERYC NDTALRADHG AAAVRESGAY 
QWDAINQAVA DTYLRLIRQK QRHGG