Gene Sala_2055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2055
Symbol
ID	4080122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	2164284
End bp	2165639
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	67%
IMG OID	638010429
Product	hypothetical protein
Protein accession	YP_617097
Protein GI	103487536
COG category	[S] Function unknown
COG ID	[COG1322] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.655381
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.223767
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGGAA TGTCGCTCAT CATCGCCCTT GCGGCCCTTG CCATCGGCGC GTTGATCGGC 
TGGTTGTTCG CCGCTCGCCA GTCGGGGGCG CTGATGGCTG AACGCGACGG GCTGGCCGAG 
CGGTTCAGGA GCGCCGTCAC CGACCTCGCC GCCGAGACCG AGGCGCGCCA GGCGGCGGAC 
ATCCGGCTCG CGGCGCTGCG CGCCGAGCAA GAGGCGCGCG AGGCCGCGCA CGCGGCGCAG 
GTGAGGCAGC TTCAGGACGC GCAGGCGGCG CTGACTGCGC AGTTTCGCGA GGTCGGGCAG 
GCGATGCTCG GCGAGGCGCA GAAGGAGTTT CTGGAACGCG CCGAGGCCCG GTTCCGACAG 
AGCGAGGAAA GCGCGGGCCA GCATCTGAAG GCGCTGCTTC AGCCCGTCCA CGAACGGCTG 
GAGAAATATG AAACCGCTGT GAAGAAGGTC GAAACCGAAC GGCAAAGCGC GTTCGGCATG 
TTGCAGGGGC AGATCGAATC GATGCGCGCG CAGAGCGAGC GCGTGTCGAG CGAGGCGGCC 
AAGCTCGTCA ACGCGCTCCG CAATGCGCCG AAGGCGCGCG GGCGCTGGGG CGAACAGCAA 
CTGCGCAACG TGCTCGAAAG CTGCGGGCTC AGCGAACATG CCGATTTCCA GACCGAGGTC 
AGCGTTGCCG ATGGCGACGG CGGGCGGCTG CGTCCCGACG TTGTGGTGAA GGTTCCCGGC 
GGACAGAGCC TCGTCATCGA CGCCAAGGTT TCGCTCAACG CCTATCAGGA CGCCTTCGGC 
GCGGTCGACG AGGGCGAAAA GGCGGCGCAC CTTGCCGCGC ATGCCGCGGC GATGAAGGCG 
CATGTCAACG CGCTGGGCGC CAAGGCCTAT TGGAACCAGT TCGACGACAC CCCCGATTTC 
GTCGTGATGT TCGTCCCCGG CGAACATTTC CTCGCCGCCG CGCTCGACCA TGACCACGAG 
CTTTGGGACT ATGCGTTCGA GCGCAAGGTG CTGCTCGCGA CGCCGACCAA CCTCATCGCG 
ATCGCGCGCA CCGTCGCGGC GGTATGGCGG CAGGAAAAGC TCGCCAACCA GGCGCGCGAA 
ATCGCGATGC TCGGCAAGGA ACTTTATGCG CGCATGTCGG TGATGGGCTC GCACATCGCG 
CGCGTCGGCA AAAATCTCGA TCAGGCGACG GGCGCTTACA ATGCCTTTGT CGGCAGTTTC 
GAATCGCAGG TTTTGACGCA GGCCAAGCGT TTCGAGGCGC TCGACATCGA AACCGGCGGG 
CGGGAGATTC CGACGCTGCC GGTTGCCGAA CAGGCGGCGC GCCCGCTGGC GAAGCTCGCC 
GCGGCGCCGA GCGCGGTGAA CGACGCGGGC GAATGA

Protein sequence

MDGMSLIIAL AALAIGALIG WLFAARQSGA LMAERDGLAE RFRSAVTDLA AETEARQAAD 
IRLAALRAEQ EAREAAHAAQ VRQLQDAQAA LTAQFREVGQ AMLGEAQKEF LERAEARFRQ 
SEESAGQHLK ALLQPVHERL EKYETAVKKV ETERQSAFGM LQGQIESMRA QSERVSSEAA 
KLVNALRNAP KARGRWGEQQ LRNVLESCGL SEHADFQTEV SVADGDGGRL RPDVVVKVPG 
GQSLVIDAKV SLNAYQDAFG AVDEGEKAAH LAAHAAAMKA HVNALGAKAY WNQFDDTPDF 
VVMFVPGEHF LAAALDHDHE LWDYAFERKV LLATPTNLIA IARTVAAVWR QEKLANQARE 
IAMLGKELYA RMSVMGSHIA RVGKNLDQAT GAYNAFVGSF ESQVLTQAKR FEALDIETGG 
REIPTLPVAE QAARPLAKLA AAPSAVNDAG E