Gene Sala_2201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2201
Symbol
ID	4080159
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	2312828
End bp	2314078
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	64%
IMG OID	638010579
Product	hypothetical protein
Protein accession	YP_617243
Protein GI	103487682
COG category	[S] Function unknown
COG ID	[COG2311] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.964455
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.524788
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCGGG GAACCACGAC GCGCTACGAA AGCCTCGACG CGATCCGCGG GGTCGCGGTG 
ATGGGCATCC TTGCGATGAA CATCGTCGCC TTTGCCCTGC CCTTCCCCGC CTATGGCAAC 
CCCGCCGCGG GCGGACCGCC CACCGACAGC GACGTCGCGA CATGGTTCTT CAACTTCGTT 
TTCGTGGATT CGAAGATGCG CGGCATGTTT TCGATGCTGT TCGGGGCGAG CACCCTGCTG 
GTGATCGAAA GCGCCGCCGT CGCGGGACGC AGCGGCGCGG GCGCGCATTA TTCGCGCATG 
TTCTGGCTCG CGATCTTCGG CCTCGCGCAT TTCTATCTCA TCTGGTTCGG CGACATATTG 
TTCCTTTATG CAATCTGCGG GCTGCTCATC TTCCTGTTCC GCAACCTGTC GGTGCGTGCG 
CTCCTGCTCT GGGCGATCCC CTTTTTCCTC ATCGCTATCG GTCTGCACAC GAGCCTCTGG 
GCGATGATGT CGATGGCACA GGCGGGAACG CTGCCGCCCG AAGCGGCCAC CGCGATGCAG 
GAGGCGCTGC GGCAGATGAA CGCCGATATG GGCCCGTCCA CCCCCGTCTA TGCCGAAGAG 
AAGGCGCTCT ATCTCGGCAG CTATGCCAGC ATCGTCGCAT ATCGCACCGG CGCGATGGCG 
GGCGATCCGC TCTTCTTCCT CGGCCTGTTC CTGTGGGAAA CGGTGGGGCT GATGCTGATC 
GGCATGGCGC TGTTCAAATC GCATATGCTG ACCGGCGAAT GGGAGGCGGC GCGCTATCGC 
AAATGGGCGA TCGCCTGTTT TGCGATCGCC GTGCCGCCGC TCGTCGGGCT CGCCCTCTAT 
CAGATGCGAA CGGGTTATGA CGCGGTATCG GTCTTCGGTT CGACGATCGC GCTGTCGGTG 
CCCTTCGACA CGCTGATGAC GATCGGCTGG GCGGCGCTCA TCATGCTGCT GGTCAAGACA 
GCGGCCAGCC ACGCCCTGCG CGCGCGGCTC GCGGCGGCGG GGCGCATGGC CTTCACCAAT 
TATCTCGTCA CCTCGATCGT GATGACGACG ATATTTTACG GCTATGGGCT CGGCCTCTTC 
GGCAGCATCG GCCGCCTGCC GCTCTATCTT TTCTGCATCG GCATGTGGGC GGCGATGCTG 
CTGTGGTCAA AGCCCTGGCT CGACCGTTTT CAATATGGCC CGCTCGAGTG GCTGTGGCGC 
AGCCTGTCGC GCGGGCAGGT GCAGCCGATG CGAAAACGCT TGCCGGGCTG A

Protein sequence

MNRGTTTRYE SLDAIRGVAV MGILAMNIVA FALPFPAYGN PAAGGPPTDS DVATWFFNFV 
FVDSKMRGMF SMLFGASTLL VIESAAVAGR SGAGAHYSRM FWLAIFGLAH FYLIWFGDIL 
FLYAICGLLI FLFRNLSVRA LLLWAIPFFL IAIGLHTSLW AMMSMAQAGT LPPEAATAMQ 
EALRQMNADM GPSTPVYAEE KALYLGSYAS IVAYRTGAMA GDPLFFLGLF LWETVGLMLI 
GMALFKSHML TGEWEAARYR KWAIACFAIA VPPLVGLALY QMRTGYDAVS VFGSTIALSV 
PFDTLMTIGW AALIMLLVKT AASHALRARL AAAGRMAFTN YLVTSIVMTT IFYGYGLGLF 
GSIGRLPLYL FCIGMWAAML LWSKPWLDRF QYGPLEWLWR SLSRGQVQPM RKRLPG