Gene Sala_0643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0643
Symbol
ID	4082733
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	656711
End bp	657910
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	67%
IMG OID	638009002
Product	protein of unknown function DUF900, hydrolase-like protein
Protein accession	YP_615697
Protein GI	103486136
COG category	[S] Function unknown
COG ID	[COG4782] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.399465
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.101765
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCGTG CCCGCCAGCT GGCGGCGGCG TGCGGCGCCG CGCTCGCGCT GTCGGGGTGC 
AGCATTGCGG CGGTCGACTA TGGCAAGATC CGCCACGCCG AATATGTCGC CGACCAGCGC 
TGCGATGCGC AGCCGGGCGC GGTCGTCGAT GGCGCGGCGC TGCCCCACTT CTTTGTGACG 
AGCCGCCTGC CCGACTGCCG CGCGAGCGAG ATCGAACTGC TGCACCACCG CGGCGACCAT 
GTACGGTACG GCCGCTTCGA CGCGCCGCGC GATGTTGTGG TGGCAAAGAA AAAACGCTTC 
CTGCCGCCGC TCGCCTTTCA GGCGGCGCCC GACTGGTGGC GCGCGCTGCA GGCCGAAACC 
GACCGCAAGC AGGGCCGCGT GCTGCTCTAT GTCCACGGCT ATCGCGAGAG TTTCGCAACG 
ACGTCGAAGG ATGCGGCGCA GATCGCGCGG ATGACAGGGT TCGACGGGCC GATCATCGAA 
TATAGCTGGC CGTCGCAGGG CAAGCTCTTC AGTTATGTCG TCGACGAAAC GAACATGTAT 
CACGACGTCC GCAACTTCCG CGATTTCCTG AAAACCCTCG CCGAACAGGG CTGGGTCAGG 
GAGATCGTCA TCGTCTCGCA CTCGCTGGGC GCACGGCTGG TGATCCCCGC GGTCGCCTAT 
GTCGATCGCG CGTCGAGCAA CGCCGACAGC AGCAATATCT CGAACATCAT CCTCGCCTCA 
CCCGACTTCG ACCGCGAGAC GTTCGAGCGT GACATCGAAG AGGAAGTGCT GTCGGCGCGG 
CGCGTCGCAA ACGACCGGCG CATCACCATC TATGCGTCGC GCGCGGACAG GGCGCTCGCG 
GCGTCGCGCG CGATCCACGG CTATCCGCGA TTGGGCTCGC CCTATTGCTT CAATCCGTTC 
GAGGCGGCGG AACTGAAGGC CAGGGGGCTT CCCGAACGCT GCTATCCCGC GCCGCGCGCC 
GGGCTGACGG TGATCGACAC GACCGACGTG TCGCGCGGAT CGACGGGGCA CAGCAATATC 
CTGCTGAGCG CGCCCGCCTG CCGCGACTTC ATCGACGTCG TGGCGGGCAA GCGCACCCGG 
CCCGAGCGCG TCGCGACCCC GTGGACGCAT GTGTTCCGGC TGGAACCCGA CCCGGCACTG 
ACCAAGGCGG AGCACGACGC AATATGTCGC CGCACCGCCG AAGCGGGCGA CGACCGCTGA

Protein sequence

MMRARQLAAA CGAALALSGC SIAAVDYGKI RHAEYVADQR CDAQPGAVVD GAALPHFFVT 
SRLPDCRASE IELLHHRGDH VRYGRFDAPR DVVVAKKKRF LPPLAFQAAP DWWRALQAET 
DRKQGRVLLY VHGYRESFAT TSKDAAQIAR MTGFDGPIIE YSWPSQGKLF SYVVDETNMY 
HDVRNFRDFL KTLAEQGWVR EIVIVSHSLG ARLVIPAVAY VDRASSNADS SNISNIILAS 
PDFDRETFER DIEEEVLSAR RVANDRRITI YASRADRALA ASRAIHGYPR LGSPYCFNPF 
EAAELKARGL PERCYPAPRA GLTVIDTTDV SRGSTGHSNI LLSAPACRDF IDVVAGKRTR 
PERVATPWTH VFRLEPDPAL TKAEHDAICR RTAEAGDDR