Gene Sala_1585 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1585
Symbol
ID	4083022
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	1660411
End bp	1662372
Gene Length	1962 bp
Protein Length	653 aa
Translation table	11
GC content	60%
IMG OID	638009954
Product	polysaccharide biosynthesis protein CapD
Protein accession	YP_616631
Protein GI	103487070
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1086] Predicted nucleoside-diphosphate sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.216403
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.968528
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTTGAAC GATTCTTCAC TGATGCTTCG ACCCAAATGA TCACGTTCGC TGCGCGTATG 
CTTTTCTGGC CGCGTTGGGG AAAGCTGCTG CTTGTTCTCG TTTGCGACGC GATTTTGGGA 
CTGGTAGCGT CCGCGATGGC CTTTTCCATT CGGTTGGGCG AATGGAGTTC CGATGACTGG 
CCGGTCCTGC GCTTTGGCCT CACCATGTTG TTGCTATGGT TTCCGATTGC CTTTTGGCGC 
GGGATCTATT CGGCCATATT TCGATACGCC GGTCGCGGGG TATTGATCTC GCTGGCGGTG 
GCCGTCGCCA TGATGACGGT GCCGCTGATC GTCATCTATA TGTATGTCGG TTATCCAGGT 
GTGCCTCGGA CGATCGCCAT TCTCGGCCCG ATCCTGTTCC TGCTGCTTAT GGGAGTCGCG 
CGGATCGTCG GCCGCTATGT GCTGGTGGAT CTTTTCCATT CGCGTGACTT TGTGGGGCGC 
GAGCGGAACG TGCTCATCTA TGGTGCCGGC ACGACCGGTC AGCGATTGGC AGCATCTTTG 
AGTTCCGAAG GCGGCCTGAG GGTTGCGGGC TTTCTTGACG ATGATCGTGA CAAGCGGGGC 
AAGCGAATAG ACGGTGCCCG CATCTTTCAC AGCGACGATA TCGAAAGCGT GCTGAATCAG 
CTCGGCGTCA CCGACATCGT TCTGGCGATG ACGCAGGTCG GCGATGAGCG GCGCAAGCAG 
ATCATCCGGA ATCTGGCGCG GTTCAGCATA AACGTCCAGA TGCTTCCACC CGTCAGGGAC 
ATTCTTGAAG GCAAGATTTC GGCAAGCGCC ATCCGTCCGA TAGAGGTCGA GGATCTGTTG 
GGTCGCCCGC CGGTGGCACC CGACCGGGAA TTGTTGTCGC GGTCCGTCAA GGGCAAGCAT 
GTGATGGTAA CCGGCGCCGG CGGTTCGATC GGCAGCGAAT TGTGCCGACA GATACTACGG 
CTGGCACCGC ACTCGCTCAC CCTCGTCGAA TCCAGTGAGT TTTCCCTCTT CAGGCTTCAA 
AACGAACTGG AAGCGATCCT CGATCGGCTC CCCGACGGTA TCCGGCCCCT TCTTCGGGCG 
AAATTGTCGA ATGTTGCGGA TGCCGCAGCG GTGGAGCGCC TGTTCGCTGA TGAGGCGCCC 
GACACCATCT ATCATGCCGC GGCGTACAAG CATGTGCCGC TGCTGGAGGA GAACCCGCTT 
GACGGCGTCG CCAACAATAT CCGCGGCACA CGCAACATGG CCGAGATGGC CGTCAAAAAG 
GGTGTCGGTC GCTTTATTCT GATCAGCACC GACAAGGCCG TGCGTCCTCC GAACGTGATG 
GGGGCCAGCA AACGCGTCTG CGAGATGCTG CTGCAGGACA TGAGCCGGTC GCGGAAGCCC 
GACGGCACCA TTTTCTCGAT GGTTCGCTTC GGCAACGTGC TGGGTTCGAG CGGATCGGTC 
GTTCCGACCT TTCGACAACA GATCGAACGC GGCGGCCCGG TGACGGTGAC CCACCGCGAT 
GTTACACGCT ATTTCATGAC GATCCCCGAA GCGGCCGAGC TGGTGATCCA GGCAGGCAGC 
ATGGCGACGG GCGGCGAAGT GTTCCTGCTC GATATGGGGG AGCCGGTGCG CATCTGGGAC 
CTCGCCGAAA CCATGGTGCG GCTGTCCGGC CTTACGATCC GTTCGTCCGC CAACCCCGGT 
GGCAGCATCG AGATCGTCGA GCGCGGGTTG CGCAAGGGCG AAAAATTGTT CGAGGAACTT 
CTGGTCGGCG AGGAATCGCA GCCCACCGCG CATCCGCGGA TCATGCAGGC GCGCGAAGAA 
TGTGTCAGCC ACGAGTGCCT TTATGAATAT CTGACGGCAA TCGAGGCCGC GATTGCGGCG 
GCCGATCCCC GTGGTTGCCG AGCCGCATTG AAACGGCTAG TGCCCACCCT GCACGATCAG 
TCCCCAGCAA CCGTCCCCGC GCCGGAACAT TCAACTAGAT GA

Protein sequence

MFERFFTDAS TQMITFAARM LFWPRWGKLL LVLVCDAILG LVASAMAFSI RLGEWSSDDW 
PVLRFGLTML LLWFPIAFWR GIYSAIFRYA GRGVLISLAV AVAMMTVPLI VIYMYVGYPG 
VPRTIAILGP ILFLLLMGVA RIVGRYVLVD LFHSRDFVGR ERNVLIYGAG TTGQRLAASL 
SSEGGLRVAG FLDDDRDKRG KRIDGARIFH SDDIESVLNQ LGVTDIVLAM TQVGDERRKQ 
IIRNLARFSI NVQMLPPVRD ILEGKISASA IRPIEVEDLL GRPPVAPDRE LLSRSVKGKH 
VMVTGAGGSI GSELCRQILR LAPHSLTLVE SSEFSLFRLQ NELEAILDRL PDGIRPLLRA 
KLSNVADAAA VERLFADEAP DTIYHAAAYK HVPLLEENPL DGVANNIRGT RNMAEMAVKK 
GVGRFILIST DKAVRPPNVM GASKRVCEML LQDMSRSRKP DGTIFSMVRF GNVLGSSGSV 
VPTFRQQIER GGPVTVTHRD VTRYFMTIPE AAELVIQAGS MATGGEVFLL DMGEPVRIWD 
LAETMVRLSG LTIRSSANPG GSIEIVERGL RKGEKLFEEL LVGEESQPTA HPRIMQAREE 
CVSHECLYEY LTAIEAAIAA ADPRGCRAAL KRLVPTLHDQ SPATVPAPEH STR