Gene Sala_0601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0601
Symbol
ID	4080629
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	610286
End bp	611737
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	67%
IMG OID	638008960
Product	bacteriophage N4 adsorption protein B
Protein accession	YP_615655
Protein GI	103486094
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATCGG TGGGGCGGGG CTGGCAAGTG GAGCTATCGA CCGGGTGGCT GGAATGGCTG 
GTGCTGGGGG CGGGCCGCGA ACTGATGCTG TTCGCATCGG TCGGCATATT GCTGATCGGG 
CTCGACGATC TGTTGCTCGA CGCGCTGTGG CTGGCGACGC GCGGGCAGCG CCGAGGCGAA 
ACCGCGAGAG CGCCGCCGAT TGAGGGGCGT ATCGCCATTT TCGTGCCGGC GTGGGACGAG 
GCCGCGGCGC TGCCCGCGAT GCTTTGCCGG ACCCTTGCCG CGTGGGACGG CGAGGATTTC 
CGGCTCTATG TCGGATGCTA TCCCAATGAC ACGGCGACGA TCTATGCCGT CTCGCAATTG 
GTCGCGCGCG ACGCGCGGCT GCGGCTGGTG ATCGGCGAGA GCGAAGGCCC GACGACCAAG 
GGCGACAATC TGAACAGGCT CTGGGCCGCG CTTTGTGCCG ACGAACGGGT GGAGGCCCGG 
CGCTTTGCCG CGATCGTGCT TCACGATGCC GAAGATCATG TCCATCGGCA CGAACTTGCG 
CTCTATCGGC AGCATTTGGC TCATAATGCG ATGGTGCAGA TTCCCGTCGT GCCGATAATC 
GACCGGCGTG CGCGCTGGAT CGGCGGCCAT TATGCGGATG AGTTTGCCGA GGCGCACGGC 
AAGGATATGC CGGTGCGCTC GCGCCTTGGC CTGCCGCTGC CCTCGGCCGG CGTCGGCTGC 
GCCTTGACCC GCAGCGCGTT GGCCCTGCTC GCGATGGAGC GAGGGGGGTG TCCCTTTTCG 
AGCGACAGCC TGACGGAGGA TTATGAGATC GGGATGGTGA TCGGCGCCTA TGGCCTCGGC 
GCGCGCTTCG TCGATGCGGC CGATCCCGCA GGCGACCGGA TTGTGTCGCG GGGCGCGTTT 
CCGGGCCGCA TCGACGCCGC GGTTCGGCAA AAGTCGCGCT GGATCGCCGG CATCGCAATG 
GCGGGCTGGG ATCATCTGGG TTGGCCCGGC TGTCGCCTGG GTCACAAGCA ACGATCGACG 
GGACGCGACC TGCTCGCGCG CTGGATGCTC TGGCGCGACC GTCGCGCGCC GCTCGCGGCG 
CTCATCCTGC TGGCCGCCTA TGCGGGGCTC ATTCTCGTCG CAGCGGGGGT GGCGGGACAA 
TTGCTGCTGG GCTGGAATGC GATCGAACCG GGGCCGACAT TGCAATGGCT GCTCGTCGTA 
AACGCGCTGC TTCTCGGCTG GCGCATGGCG CTGCGTATCC ATTTCACCGC GCGCCTTCAT 
GGCTGGCGCG AAGCGTCGTT TGCCGTACCG CGTGCCTTTG TGGCGAACAT CATCGCCATG 
CTCGCGGCAC GGCGTTCCGT GCTGCTTTAC TGGCGGATAT TGCGCTCGGG CGAAGTGGTG 
TGGGACAAGA CCGACCACAG CGAAACCGGC CTCGCGGTCG CGGATGCGCC GGTGCGCGTG 
GCGATGCGGT GA

Protein sequence

MPSVGRGWQV ELSTGWLEWL VLGAGRELML FASVGILLIG LDDLLLDALW LATRGQRRGE 
TARAPPIEGR IAIFVPAWDE AAALPAMLCR TLAAWDGEDF RLYVGCYPND TATIYAVSQL 
VARDARLRLV IGESEGPTTK GDNLNRLWAA LCADERVEAR RFAAIVLHDA EDHVHRHELA 
LYRQHLAHNA MVQIPVVPII DRRARWIGGH YADEFAEAHG KDMPVRSRLG LPLPSAGVGC 
ALTRSALALL AMERGGCPFS SDSLTEDYEI GMVIGAYGLG ARFVDAADPA GDRIVSRGAF 
PGRIDAAVRQ KSRWIAGIAM AGWDHLGWPG CRLGHKQRST GRDLLARWML WRDRRAPLAA 
LILLAAYAGL ILVAAGVAGQ LLLGWNAIEP GPTLQWLLVV NALLLGWRMA LRIHFTARLH 
GWREASFAVP RAFVANIIAM LAARRSVLLY WRILRSGEVV WDKTDHSETG LAVADAPVRV 
AMR