Gene Sala_3102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_3102
Symbol
ID	4082838
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	3249956
End bp	3251356
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	67%
IMG OID	638011488
Product	hypothetical protein
Protein accession	YP_618139
Protein GI	103488578
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0806544
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCGCC TTTCGCCTAT AGGGAGGCAT GACCGAAGCC GACAGGGGCC GGGCGCCGCC 
GCGCCGCATC ACCGCCCGAT GACCCCTTTT CCCTGGTCCG ACGTCGCGAT CATCGCGATT 
CTCGTCCTTC TCAACGGCCT GTTCGCGATG TCCGAACTGG CGATCGTCTC GGCGCGGCAG 
CCGCGGTTGC AGGCAGCCGA AAAGCGCGGC AGCCGCGGCG CGAAGATCGC GCGCCAGCTC 
GCGTCCGACC CCGGCCGCTT CCTGTCGACG GTGCAGGTCG GCATCACGCT GATCGGGATT 
CTCGCCGGCG CCTATTCGGG CGCCAGCCTG GGCGCGCCGG TCGCGGAGCG TTTGCAGGCC 
TGGATAGGAC TCGACGACGA AACGGCGCTG ACCGCGGGCT TTGCCGTAGT CATCGCACTC 
ACGACCTATG CCTCGCTGAT TGCTGGCGAG CTCGTGCCCA AGCAGTTTGC TTTGCGTGCG 
CCCGAACCGA TCGCCATTTT CATCGCCTTG CCGATGCTGT GGCTGTCGAA AATCGGTGCG 
CCGCTGGTGT GGCTGCTCGA CCGCAGCTCG GCGCTGGTAT TTCGCCTGCT CGGGCTGAGA 
CGTGAATCGG AGGAGCGAGT GACCGCCGAG GAGCTGCACC TGATCGTCGC CGAAGCGTCG 
AAATCGGGGG TGATCGAGGA AAGCGAGCGG GCGATCATTT CGGGCGTCGT GCGCCTCGCC 
GACCGGCCGG TGCGCGAGGT GATGACGCCG CGCAAGGATG TCGACTGGAT CGACATTTCG 
CTCGATGCGC GCGGCCTGCG CGACAGGCTG CTCGAAACGC CGCACAGCCG CCTGCCGGTC 
GCGCGCGGGT CGGTCGACGA GATCGTCGGC GTGGTACAGG CGCGCGACAT CGCCGCGGCG 
CTGTTCGCCG GGCAGACGCT GGACCTGGAA AAGCTGATGC GCCCCGCGAA GGTCATCCAC 
GACCAGCTCG ACGCGATGGA CGCGCTCGAA GCCTTGCGCG CGGCCGAGGT GCCGATGCTG 
CTGGTCCACG ACGAATATGG CCACTTCGAC GGGCTGGTGA CGCCCGCCGA TCTGCTTTCG 
GCGATTGCGG GCGAATTTGC GTCGGACCAG GACATCGGCA GCGATCCCTA TGTGGTCGAG 
CGCGACGACG GCAGCCTGCT GATCGCGGGA GCGATGCCCG CCGACCAGAT GGCCGAGCGG 
CTGGGGATCG AATTGCCCGG TGACCGCGAC TATGCCACCG CCGCGGGCCA CGCGCTCGCG 
GTGCTCAAGC ATTTGCCTGT GGAAGGCGAA AGCTTCACCG ACCGGGGCTG GAAGTTCGAG 
ATCGTCGACA TGGACGGACG CAAGATCGAC AAGCTGCTCG TCAGCGACGT CCGCAAGCCG 
AAGGGCGCCG AGGCCGAATA G

Protein sequence

MLRLSPIGRH DRSRQGPGAA APHHRPMTPF PWSDVAIIAI LVLLNGLFAM SELAIVSARQ 
PRLQAAEKRG SRGAKIARQL ASDPGRFLST VQVGITLIGI LAGAYSGASL GAPVAERLQA 
WIGLDDETAL TAGFAVVIAL TTYASLIAGE LVPKQFALRA PEPIAIFIAL PMLWLSKIGA 
PLVWLLDRSS ALVFRLLGLR RESEERVTAE ELHLIVAEAS KSGVIEESER AIISGVVRLA 
DRPVREVMTP RKDVDWIDIS LDARGLRDRL LETPHSRLPV ARGSVDEIVG VVQARDIAAA 
LFAGQTLDLE KLMRPAKVIH DQLDAMDALE ALRAAEVPML LVHDEYGHFD GLVTPADLLS 
AIAGEFASDQ DIGSDPYVVE RDDGSLLIAG AMPADQMAER LGIELPGDRD YATAAGHALA 
VLKHLPVEGE SFTDRGWKFE IVDMDGRKID KLLVSDVRKP KGAEAE