Gene Sala_1102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1102
Symbol
ID	4082040
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	1131983
End bp	1133611
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	70%
IMG OID	638009464
Product	hypothetical protein
Protein accession	YP_616152
Protein GI	103486591
COG category	[S] Function unknown
COG ID	[COG4655] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTATCC GCTCGCGTCT CGCATCGCTG ATCCGCTGCC GCCGCGCGGG AATCAGCATC 
GCTGCGGCGA TCGGTATGCC GATGCTGATC GGCGCGGCGG CGCTCGCGGT CGATGTCGGC 
TCGCTTTATC TCGACCGGCG CAAGCTTCAG GGCATCGCCG ATGCCGCGGC GCTGGCGGCG 
GCGGGTCGCC CCGGCGAAGA GCGCGCGGCG GTCGAGCGGA TCATCGCCGC CAATTGCACC 
TGCGTCATCC GTATCGAGGC GCTGACCGTC GGCACCTATA CCGCCGATCC GGCGCGCCCG 
GCCGAGGCGC GCTTCGCAGC GGGCGGGGCG GCGCCTAACG CGGTGCGGAT CACGCTGTCG 
CAGGACCGGC CGCTGTTTTT CGGCGGCTTC CTGACAGGAC GGCCTGACAG CATCATCCGC 
GCGACCGCGA CGGGCGCGCG GCGCGGTTAT GCCGCCTTTT CGCTGGGGTC GCGCGTCGCG 
GCGCTGAACG GCGGCGTGGC GAATGCGCTG CTGTCGGGGC TGACCGGCAG CGAGGTCAAC 
CTGTCGGTGA TGGACTATAA CGCGCTTGCC AGCACCGACA TCGACCTGCT CGCCTTTTCC 
GACGCCCTCA GGACCGAGAT CGACGCCGAT GTGCTGACCT TTGGCCAGAC GCTCGACAGC 
CAGGTGACGC TGCCGCAGGT GGTGTCGGCG CTCGCGAGCG CTTCGAGCGG TGATGCGGCG 
GCGGCGCTCG AGCGGATCGC CGATACCGCC TTGCCACGCG GCCTGATCCC CTCGCGCGCG 
ATCGACCTTG GCCCGCGCGC GTCGAGCGTC CGCGTCGATG CCGCGAACCC GGTGAGGGTC 
AATGCGCTGA GCCTGCTGCG CACGATGTTG CTGCTCGGCA GCGCGAACCG ACAGGTCGAC 
CTGTCGCTCG CGAGCGAACT GCCCGGCGGA TCGGGGATCG ACGTCGCGCT GCTGATCGGC 
GAACCGCCTG CGGATTCGCC GCTGATCGCC GTCACCGATA CGAACGATGT GATCGTCCGC 
ACCGCGCAGG TGCGGCTCAA AATCGATACG CGCATAGCGA CACCGCTGGC GAGTGTTCGC 
GTCCCGCTGC TCGCCGAACT GGGCTCCGCC TCTGCGCGGA TCACCGATAT CGATTGCGCC 
CCGAACAGCA GTGCCGCGGT GACGCTCGGC GTCGTCACGT CGCCCGCCAT GGTGGCGATC 
GGCACGGTCG ACGATGGCGA TTTCGCCGAC ATGCGGCGCC GGCTCGACCC GATGCCCGCG 
CGTCTCGTCA AACTGCCGCT CGTCAGCATC GACGCGCAGG CTGAAATGAC GCTGTCGGAC 
CTCAACGAAA AGCCCGTCGC CTTTTCGCGC GGCGAGATCG ACGACGGGAG GGTGAAGACG 
GTGTCGAGCA GCGGGCTGGT CGCGGGCGCG GCCGAATCGC TGTCCGACGA GCTGGAGCTC 
GACGTCAATG TGGTGGGGCT GGGGCTCAAT CTCGGCGCGC TGACCTCTGC GGTCGGCGAC 
ACGGTCGCGC TCGCTGCGCC CGTCATTGAC GGTGTCCTCG GCGACCTCAC CGGTCTGCTC 
GGTCTGCATG TCGGGCAGGC CGATACGCGG ATCAATGCGC TGCGCTGCGG CCGTGCGCGG 
CTGGTGTGA

Protein sequence

MAIRSRLASL IRCRRAGISI AAAIGMPMLI GAAALAVDVG SLYLDRRKLQ GIADAAALAA 
AGRPGEERAA VERIIAANCT CVIRIEALTV GTYTADPARP AEARFAAGGA APNAVRITLS 
QDRPLFFGGF LTGRPDSIIR ATATGARRGY AAFSLGSRVA ALNGGVANAL LSGLTGSEVN 
LSVMDYNALA STDIDLLAFS DALRTEIDAD VLTFGQTLDS QVTLPQVVSA LASASSGDAA 
AALERIADTA LPRGLIPSRA IDLGPRASSV RVDAANPVRV NALSLLRTML LLGSANRQVD 
LSLASELPGG SGIDVALLIG EPPADSPLIA VTDTNDVIVR TAQVRLKIDT RIATPLASVR 
VPLLAELGSA SARITDIDCA PNSSAAVTLG VVTSPAMVAI GTVDDGDFAD MRRRLDPMPA 
RLVKLPLVSI DAQAEMTLSD LNEKPVAFSR GEIDDGRVKT VSSSGLVAGA AESLSDELEL 
DVNVVGLGLN LGALTSAVGD TVALAAPVID GVLGDLTGLL GLHVGQADTR INALRCGRAR 
LV