Gene Sala_3014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_3014
Symbol
ID	4082846
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	3155863
End bp	3157629
Gene Length	1767 bp
Protein Length	588 aa
Translation table	11
GC content	72%
IMG OID	638011401
Product	single-stranded-DNA-specific exonuclease RecJ
Protein accession	YP_618052
Protein GI	103488491
COG category	[L] Replication, recombination and repair
COG ID	[COG0608] Single-stranded DNA-specific exonuclease
TIGRFAM ID	[TIGR00644] single-stranded-DNA-specific exonuclease RecJ

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.858016
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGG CGGCACTGGG AATCACCTGC TCGATCGCGG GCCAGTCGTG GCGCTGGCGG 
CGTGCGAGCG CCGACATGGC GGCGGAAAAT CTCGCGCCCG ACGACCTTGT CACGCAATTG 
CTGCTCGCGC GCGGGGTGGC GCGCGACGAT CTCGATCGCC AGCGCACCCC GACCCTGCGC 
GGCTTCATGC CCGACCCGTC GCTGTTCCGC GACATGGATG CCGCCGCGGC GCGGCTCGCC 
GATGCCGTCG AACGCCGGGA GGCGGTGACG ATCTTCGGCG ATTATGACGT CGACGGGGCG 
ACATCGGCCG CGCTGCTCGT CCGCCTGCTG CGGGCGCTCG GCACAACTGT CGGCGCCTAT 
ATCCCCGACC GTCTGATGGA AGGCTATGGC CCGTCGGGCG CCGCGCTGGT GAAGATCGGC 
GAGGCGGGGT CGAAACTTAT CGTCACCGTC GATTGCGGCG CACAGGCGTT CGAGGCGATC 
GCCGAAGCCA ATGCCGCCGG CGTCGAGGTG ATCGTCGTCG ACCATCACCA ATGCGCGACC 
AGCCTGCCCG CCGCGCTTGC GCTGGTGAAC CCCAACCGGC TCGACGAGTC GCCCGACGCA 
GCGGTCCACG GCAATCTCGC CGCGGTCGGC GTCGCCTTCC TGCTCGGCGC GGCGCTGCTT 
CGCACATTGC GCGCGCGCGG CTTTTTTGCG GGCCGCGAGG AACCCGCGCT GATCGAGCTT 
CTGGACCTTG TCGCACTCGG CACCGTCGCC GACGTCGCGC GGCTCACCGG CTTCAATCGC 
GCGCTGGTGA CGCAGGGGCT GAAAGTGATG GCGCGGCGCG GCAATATCGG CCTCGCCGCG 
CTGATGGACG CGGCGCGGCT GACCAGGCCG CCGGGCGCAA GCGACATGGG CTTCGCGCTC 
GGTCCGCGCA TCAACGCGGG CGGGCGCGTC GGCAAGTCGG ACCTCGGCGT GCGCCTGCTC 
ACGACCGACG ATCCGCAGGA AGCCGCCGAT ATCGCGCAGC AACTGTGCCG CCTCAACGAG 
GAGCGCCGCA CGATCGAGGC GGCGGTGCTC GACGAGGCGC TGGCGGCGAG CGCCGCGTGC 
GGCAACGCGC CCGTCGCGAT TGTCGCCGGC GAAGGCTGGC ACCCCGGCGT GATCGGCATC 
GTCGCCGGGC GGCTCAAGGA ACGGTTGCAC CGCCCCGCGA TCGTGATCGC GGTGGACGCG 
GACGGTATCG GCAAGGGATC GGGGCGCTCG ATTTCGGGCG TCGACCTGGG CGCAGCCATT 
CTCGCCGCCA AGGAAACGGG CTTGCTCGTC GCCGGCGGCG GCCATGCGAT GGCGGCGGGA 
CTCACGGTGG CCGCCGACCG GGTCGATGCG CTTGGCGCCT TTTTGAGCGA CCGCCTCGCC 
GCCGATGTCG AGCGCGCGAG CGGCGAGCGT GCGCTGCTGA TCGACGCCGT GCTCGCGCCG 
CGCGGGATCT CGCCGCTCTG GTGCGACGCG ATCGAAAGCG CTGGCCCCTA TGGCGCCGGT 
TGGCCCGCGC CGCGCGTCGC GACGGGGCCG GTGCGAATCG TCGAATCGGG GATCGTCGGC 
ACCGATCATG TCCGCCTGAT CGTCGCGGGC GACGATGGCG CGCGGTTCAA GGCGGTCGCC 
TTTCGCAGCG CCGAAACGGT GCTGGGCCAG ACCCTGCTCG GCGCGCGGGG ACGCAAGCTG 
TGGCTCGCGG GCCGGGCAAA ACGCGACGAC TGGGGCAGCC GCCCCGCCGC CGAGCTGCAC 
CTCGAGGATG CTGCCTGGGC CGACTGA

Protein sequence

MSEAALGITC SIAGQSWRWR RASADMAAEN LAPDDLVTQL LLARGVARDD LDRQRTPTLR 
GFMPDPSLFR DMDAAAARLA DAVERREAVT IFGDYDVDGA TSAALLVRLL RALGTTVGAY 
IPDRLMEGYG PSGAALVKIG EAGSKLIVTV DCGAQAFEAI AEANAAGVEV IVVDHHQCAT 
SLPAALALVN PNRLDESPDA AVHGNLAAVG VAFLLGAALL RTLRARGFFA GREEPALIEL 
LDLVALGTVA DVARLTGFNR ALVTQGLKVM ARRGNIGLAA LMDAARLTRP PGASDMGFAL 
GPRINAGGRV GKSDLGVRLL TTDDPQEAAD IAQQLCRLNE ERRTIEAAVL DEALAASAAC 
GNAPVAIVAG EGWHPGVIGI VAGRLKERLH RPAIVIAVDA DGIGKGSGRS ISGVDLGAAI 
LAAKETGLLV AGGGHAMAAG LTVAADRVDA LGAFLSDRLA ADVERASGER ALLIDAVLAP 
RGISPLWCDA IESAGPYGAG WPAPRVATGP VRIVESGIVG TDHVRLIVAG DDGARFKAVA 
FRSAETVLGQ TLLGARGRKL WLAGRAKRDD WGSRPAAELH LEDAAWAD