Gene Sala_1667 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1667
Symbol
ID	4081050
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	1754744
End bp	1755844
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	67%
IMG OID	638010041
Product	hypothetical protein
Protein accession	YP_616713
Protein GI	103487152
COG category	[S] Function unknown
COG ID	[COG2855] Predicted membrane protein
TIGRFAM ID	[TIGR00698] conserved hypothetical integral membrane protein

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAGACT GCGAAGCGAT GACCCGCGGC CCCGCCCCTT CCGAACCGTA TCGCGGGGAT 
CTTTTCGGGG AAATCCACCT CGCCGATATG ACCGATGCTG CGCCAACGCC CGGGATCGCC 
CGATATTTCC CCGGCCTGGC GATCTGCGCC GCGGCGGCTG GCGCGGCCGG ATGGCTCTCG 
GACCATTATG GTGTGCCCGT CATCCTGCTC GGCCTGCTCA TCGGGCTCGC GCTCAATTTC 
GTCGCGCGCG ATGCGCGCAC CCATCGCGGT CTCGACTTCG CCTCGCACAC CTTCCTGCGG 
ATCGGAATTG TGCTTCTCGG CTTTCAGGTC AGCATCGCAC AGATCGTCGC GCTGGGAGCG 
CTCCCGTTTG CCGCACTGAT CCTCATCATG GCGGTGGCCT TTGCCGCCGG ACTTGCCGGC 
GCTCGCCTGT CGCGCCAGTC ACCATATGCG GGCCTCCTTG CCGGTGGCGC GACGGCGATT 
TGCGGCGCCA GCGCCGCGCT CGCGCTCTAT GGCATCGTCG GCAAAGAGCG GCTCAGCCAG 
GCACAATTTG CGCTGACGCT GGTGGGTGTG TCGATGGCCA GTGCGCTGGC GATGTCGCTT 
TATCCCGCCA TTGCGGCCGA ACTGGAACTC AGCGACGCGC AGGCCGGTTA CCTGATCGGC 
GCCTCGATAC ACGATGTCGG CCAGGCAATC GGCGGCGCTT ATGCTGTTTC GGACGCAGCA 
GGCATCGATG CCACGATCGT CAAGCTGGCG CGCGTTACGC TGCTTGCCCC CGTCGTGCTG 
CTCGTTTCGC TGGTGATCGG CCCGGCGCGC GCCGGGCCGT CCCGACCCAG CTGGCGGCGA 
CTGGGCATGC CGTGGTTCAT CACGCTCTTT CTTGCCGTTG TCGCGGTCAA CAGCCTGATC 
GACCTTCCTG CCGTCGCGGC AACCAAGGCG CTTGCCGCAT CCAAGGCGCT GCTGCTGCTC 
GCCGTGACGG CCACCGCCAT GCGTTCACGC ACCGACCTGC TCCTCGAGCT CGGCTGGCGG 
GCGGCCGCTC CCGTCATGGC GGCTTCGCTG GCAAGCTTTG CGGCCGCACT TTTCTTCGTA 
ATGATCGGGG TGGGTGACTG A

Protein sequence

MKDCEAMTRG PAPSEPYRGD LFGEIHLADM TDAAPTPGIA RYFPGLAICA AAAGAAGWLS 
DHYGVPVILL GLLIGLALNF VARDARTHRG LDFASHTFLR IGIVLLGFQV SIAQIVALGA 
LPFAALILIM AVAFAAGLAG ARLSRQSPYA GLLAGGATAI CGASAALALY GIVGKERLSQ 
AQFALTLVGV SMASALAMSL YPAIAAELEL SDAQAGYLIG ASIHDVGQAI GGAYAVSDAA 
GIDATIVKLA RVTLLAPVVL LVSLVIGPAR AGPSRPSWRR LGMPWFITLF LAVVAVNSLI 
DLPAVAATKA LAASKALLLL AVTATAMRSR TDLLLELGWR AAAPVMAASL ASFAAALFFV 
MIGVGD