Gene Sala_1918 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1918
Symbol
ID	4082775
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	2019746
End bp	2020930
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	70%
IMG OID	638010295
Product	hypothetical protein
Protein accession	YP_616963
Protein GI	103487402
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5653] Protein involved in cellulose biosynthesis (CelD)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.618119
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTCC ATCCTGCCTT TCCGGTCAGC AGCATCGACG CCGCGCCGCT GACGGTGCGC 
GTGGTCGATC CGCTGGCGCT GTCGGAGGGG CTGGCGGCGG CGTGGGACGG GCTGGCGGGC 
GAGGCAAGCG AGCCCAATCC CTTTGCCGAA CGCTGGTGCC TGCAATCGGC ACTGCACCTG 
CTCGATCCCG AACGCCAAGC GCGGCTTATC GTCGTGCAGG GCGGCGCGGA CGGGCCGCTG 
ATCGGCGTGA TGCCGCTCGC ACCCGCGGCG CGTTACAGCC GCCTGCCGCT GCGTCACGCC 
GTGGGCTGGG CGCACCCCAA TCATTTTCAC GGCGCGCCTC TGGTGCGCGC AGGTTTTGAA 
AGCCTGTTCT GGTCGATCCT GCTCGGCTGG TGCGATGCGG CGCCCTGGGC GCGCACCTTG 
CTGCATGTGC CGCGATTGAC CGAGGACGGG CCGCTCCACC GCGCGCTGAT CGATGCGGCG 
CGGGGGCGTG GTGGCGAGGC CGTGGTCGTC CACCGCGAGG AGCGTGCGCT GCTCGCAAGC 
GACCTCTCGC CCGCCGCCTA TTGGGACGCA GCGGTGCGCG CGAAGAAGCG CAAGGAATTG 
AGGCGGCAGG CGAACCGGCT CGCCGATGAG GGTGTGGTGC AATTTCGCCG GTGGCAGGCG 
GGCGATCCGC CGGGTCCGTG GATCGACGCC TTCCTCGCCC TGGAGGCGCG CGGCTGGAAG 
GGGCGCGCGG GATCGGCGCT TGCGAGTAAC AGCGACACCC AGGCCTGGTT CCGCGCCATC 
GTGCCCGCCG CCGCCGCGGC GGGGCGGCTC GACATGCGCG CGCTCGACCT CGATGGCCGC 
CCGCTGGCAA TGCTCGTCAA CTTCCTGTGC CCGCCCGGCG GCTTTTCGTT CAAGACCGCG 
TTCGATGAGG ATTATGCACG CTTTTCGCCG GGCGTCCTGT TGCAACAGGC GAATCTGGAC 
CTGCTCGACG ACCCGCGCAT CGAATGGGTC GACAGCTGCG CCGCGCCCGG CCATCCGATG 
ATCGACAGCG TCTGGCGCGA ACGCCGTGCG CTCGTCTGGG TCAACGTCCC GCTGACAGGG 
CGCTCCGACC GGCTGCGTTT TGCGATGCTG ATGCGCGCCG AGCGAATGTG GCGGCGCTGG 
AAGGGTGCCG CTCAGCACGC CGATGAAGTG GAAAGCCCGA CATGA

Protein sequence

MTVHPAFPVS SIDAAPLTVR VVDPLALSEG LAAAWDGLAG EASEPNPFAE RWCLQSALHL 
LDPERQARLI VVQGGADGPL IGVMPLAPAA RYSRLPLRHA VGWAHPNHFH GAPLVRAGFE 
SLFWSILLGW CDAAPWARTL LHVPRLTEDG PLHRALIDAA RGRGGEAVVV HREERALLAS 
DLSPAAYWDA AVRAKKRKEL RRQANRLADE GVVQFRRWQA GDPPGPWIDA FLALEARGWK 
GRAGSALASN SDTQAWFRAI VPAAAAAGRL DMRALDLDGR PLAMLVNFLC PPGGFSFKTA 
FDEDYARFSP GVLLQQANLD LLDDPRIEWV DSCAAPGHPM IDSVWRERRA LVWVNVPLTG 
RSDRLRFAML MRAERMWRRW KGAAQHADEV ESPT