Gene Sala_0354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0354
Symbol
ID	4081226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	366220
End bp	369297
Gene Length	3078 bp
Protein Length	1025 aa
Translation table	11
GC content	69%
IMG OID	638008713
Product	hypothetical protein
Protein accession	YP_615410
Protein GI	103485849
COG category	[S] Function unknown
COG ID	[COG4995] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.219727
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.251109
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTTC GAGTTCCGCA TTGGATGCCC GCTCTGGCGG CCGTTGTCCT GACGGTGCCG 
ACAGGCGCGC TGGCGCAGGG CGGCGATCCG ACGCTGCGCG ACAGTTTTTC GATCGGGTCC 
GAAGGCGGCG CGCTGTGCGA GGTTCAGGCA ACGGTGCGCG ACCCGGTTGT CGAGGGCATG 
TTCGAGCGCG CATGGACCGT CGTGTGCCGC GACGCGAGCC AGCCCGTCGG CACGATTCGT 
GTGCTGCGCG CGGCGACCGA CGACGCCCGC GCGCGCATCG AACGGGCGCG GGCAGACCGC 
GTGACCTGCA CGGCGGGCCG CTGCACGCTG CGCGACAGCG ACGCCGTCTG GACGACGCGG 
ATCGAAACCA ACGGCGCAAA TGCCTACACC GCCGAAGGGT TCGAAGCCTA TGCCGACGCA 
CTCGCCATCG CGCTCGAATC GGTGCGCCAG CGGCGCGTCG TTCCCGGCGT GATCCGCGTC 
GCGACAACCT CGGTCGGCGG CAATGACGGT TTTGCCCGCA CGCTCGCGGG CGCGATCGAC 
ATCGACAAGG CGCTCGCCGA GGGATACCGC CGCAACCACA GCGGCGATTA TGCCGAGGCG 
GCCGAGTTTT TCGACGCGCT GTCGCGCCGC GCGCTGGAGG AGCAGGCGGC GGTCGGCGTC 
GACGCGACCG AATTCACGCT CAATCGCGCG CTGCAACGTT CGAACCTCGG CGAATTTGCC 
GAGGCCGAAC GCCTGTTTGC CGAAGTGGAA GCGATCCCGA CCAGCGATCC GGTCCAGCTG 
CGCCTGCGTC GCAATTTCCG GGCAATCCAC GCGCTCAATC AGCGCGATCT GGACGGCGCC 
GCGGCGCGAC TGCAAGCAGC GATCCCGCCG CTCGCAACGG GCGTGATCGT CGCCGACGGC 
GCGGTGACGC TGGCGCCGGC GATCGTCGCC GGGGTGAACA GCGGCGGCGA TGCCCGGTTG 
GTGCAGGCGG GCGAACGCGA ACGATTGTCG CCGATCGAGC GGGCACAGAT CATCGACGCG 
CAGGCGGTCC ACCTGCTCGG CACCGTCGAA CGCTTGCGCG GCGATGCCGC GGCGGCCAAG 
GCGGCGCAGA TCAAGGGCCT GGCCGATGCC CTCGCGGTGC GCGAAGGGCG CGTCACCTCG 
ATCATCCGCC TGCGTTCGCA GATGCTGGGC GAACTGGCGC TCGCGGAGGA AGCGCTCGGC 
GATATCGGCG CTGCCGACGC GCGCTTTGGC GAGGCGGTCG CGCTGCTCGC GGTCGAATAT 
CCCGAAACCA CCGCCCTCGC CTCGGCGCGC GCGCGATATG CCGCCTTCCT GACCCGGCAG 
GGGCAGGACG ACAAGGCGCT GGGCATCTAT CGCGAGGTTG TCGGCGCACT CGCCGAATCG 
CAACGTTCGA CCGTGGGCAT GGCCAATATG ATGGCGCCCT ATTACCGGCT GCTCGCGGCG 
CGCGCCGACA GCGACCCCGC CGCGTTGCAG GATTTCTTCG TCGCCAGCCA GCTCCAGATA 
CGCCCCGGCG TCGCCGATAC GCAGGCCGTA CTCGCGCGCG AACTGTCGAG CGGCAGCGAT 
GAGGGCGCGC GCCTGTTCCG GCAGGCGACG ACGCTGAACC GCGACATCGA ACGCGCGCGG 
ATCGAGGATG CGCGGCTCGC GCAGCTCCCG CAATCGGCCG AAATTGCCGC GCTGCGCGCA 
GACATCCGCA CCCAACTCGA CAATCTGGCG TTTCAGCAGG CGGAAACGAT CGTCCGCCTA 
TCGGCCTTTC CGCAATATCG CGTCGTCGCG CCGGGCAAGC TGGACCTCGG CGAGCTGCAA 
GCGGTATTGC GCGACGATGA AGCCTATCTG AAGATGCTGG TGGTCGGCGA CAGCGTCTAT 
GCGATGCTCG TCGAATCCGG CGGCGCGATG CTCTGGAAAT CGGACATCGG CGCTGCCGAC 
CTCGAACGCG CGGTCGATGC GATCCGATCG ACGATCTCGA TCGTCGAAAA CGGCCGCCGC 
GTCACCTATC CCTTTGATGC GGCGACGGCG CGCCGTCTCT ACGGCCAGCT TTTCGGCCCC 
GTCGCCGCGC GGCTACCGAT GGTGCCGCAT CTGATTTTCG AGCCCGACGG CGCGATGCTG 
CGCCTGCCGG TCAACCTGCT CATCACGTCC GATACGGGCC TTGCCGCTTT TGAACAGCGC 
GTGCTGGATC CCGAGGCCGA CCCGTTCGAC ATGCGCGACA TTGCGTGGCT CGGCCGCACG 
AGCCGCCCCA GCACCGCCGT TTCCGCCCTG GCCTTTCGCA ACGCGCGGCA GGCCGCGCCG 
TCGAAGGCTG CGAACCAGTA TTTCGGGCTT GGCGAGAATC TGCCGCTTGG CGACCGGCTG 
CCTTCGCTCG GCACGCGCGG CGCGGCGGGC GGCATGGACG GCGACTGCCT GTGGGACGCC 
TCGCAATGGG CGCGGCCGAT CTCCGCCGAT GAACTGGTCA CCGCGCGCAA CGCAATGGGC 
GCAGACGCGG GCGCCTTGCT CACCGGCGGC GCCTTCACCG ATACGGCGGT CAAGACCCGC 
GACGACCTTG CCGACTATCG CATCATCCAT TTCGCAACGC ACGGCCTTGT CACCGCCCCG 
CGCCCCGCCT GCCCCGCGCG CCCGGCGCTT GTCACCTCCT TTGGCGGGCA GGAATCGGAC 
GGACTGCTGA CCTTTCAGGA AATCTTCGAC CTCAGGATCG ACGCCGACCT TGTCATCCTT 
TCGGCGTGCG ACACCGCGGG CGCGGCGAGC GTCGCGGCGA CGCGCGAGGC GGGGCTCTCG 
GGCGGCGGCA ATGCGCTCGA CGGGCTGGTG CGCAGCTTCA TTGGCGCCGG CGGCCGCTCG 
GTGATTGCGA GCCACTGGCC GGCCCCCGAT GATTTCGACG CGACGACGCG GCTGATCAGT 
GGACTGTTCA CCGCCGACGA CGGCGCGAGC GTGGCCGATG CGCTGTGGGC GACCCAGCGG 
CGGCTGATGG ACGATCAGCA GACGTCCCAT CCCTATTATT GGGCGGGCTT CGCGATCATC 
GGCGACGGTG CGCAGCCGCT GCTTCGCGGC GCGCAAACGG CGCGGCACGG ACAGGCGGCC 
GGCCGCGCCG CGCGCTGA

Protein sequence

MTVRVPHWMP ALAAVVLTVP TGALAQGGDP TLRDSFSIGS EGGALCEVQA TVRDPVVEGM 
FERAWTVVCR DASQPVGTIR VLRAATDDAR ARIERARADR VTCTAGRCTL RDSDAVWTTR 
IETNGANAYT AEGFEAYADA LAIALESVRQ RRVVPGVIRV ATTSVGGNDG FARTLAGAID 
IDKALAEGYR RNHSGDYAEA AEFFDALSRR ALEEQAAVGV DATEFTLNRA LQRSNLGEFA 
EAERLFAEVE AIPTSDPVQL RLRRNFRAIH ALNQRDLDGA AARLQAAIPP LATGVIVADG 
AVTLAPAIVA GVNSGGDARL VQAGERERLS PIERAQIIDA QAVHLLGTVE RLRGDAAAAK 
AAQIKGLADA LAVREGRVTS IIRLRSQMLG ELALAEEALG DIGAADARFG EAVALLAVEY 
PETTALASAR ARYAAFLTRQ GQDDKALGIY REVVGALAES QRSTVGMANM MAPYYRLLAA 
RADSDPAALQ DFFVASQLQI RPGVADTQAV LARELSSGSD EGARLFRQAT TLNRDIERAR 
IEDARLAQLP QSAEIAALRA DIRTQLDNLA FQQAETIVRL SAFPQYRVVA PGKLDLGELQ 
AVLRDDEAYL KMLVVGDSVY AMLVESGGAM LWKSDIGAAD LERAVDAIRS TISIVENGRR 
VTYPFDAATA RRLYGQLFGP VAARLPMVPH LIFEPDGAML RLPVNLLITS DTGLAAFEQR 
VLDPEADPFD MRDIAWLGRT SRPSTAVSAL AFRNARQAAP SKAANQYFGL GENLPLGDRL 
PSLGTRGAAG GMDGDCLWDA SQWARPISAD ELVTARNAMG ADAGALLTGG AFTDTAVKTR 
DDLADYRIIH FATHGLVTAP RPACPARPAL VTSFGGQESD GLLTFQEIFD LRIDADLVIL 
SACDTAGAAS VAATREAGLS GGGNALDGLV RSFIGAGGRS VIASHWPAPD DFDATTRLIS 
GLFTADDGAS VADALWATQR RLMDDQQTSH PYYWAGFAII GDGAQPLLRG AQTARHGQAA 
GRAAR