Gene Sala_2994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2994
Symbol
ID	4082938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	3134588
End bp	3136414
Gene Length	1827 bp
Protein Length	608 aa
Translation table	11
GC content	67%
IMG OID	638011379
Product	peptidase M24
Protein accession	YP_618032
Protein GI	103488471
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.020362
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAGCC CCGTCCACGC CGAGCGCCTC GCCCGCGTCC GTGCCGAATT GAAAGCGCGC 
GGCCTCGATG GCTTCATCGT GCCGATCAGC GACGAACATA TGAGCGAATA TGTCGGCGCC 
TATGCGCAGC GCATGGCCTG GCTGACCGGC TTTGGTGGAT CGGCCGGGAC CGCGGCGGTC 
CTGCCCGAAA AGGCGGCGGT GTTCGTCGAC GGCCGCTACA CCGTGCAGGT GCGCGACCAG 
GTCGACGGGT CGCTCTTCGA CTATGTCGGG GTGCCGCAGT CGAGCGTCGC CGAATGGCTG 
GGCAGCCATG TCAGCGCGGG GCAGAGGGTT GGTTATGACC CCTGGCTGCA CGGTATAGAC 
TGGGTCCGCG GGCTGGAAAA GGCGCTGGCG GCGAAAGGTG CGAGCCTTGT CGCGGTCGAC 
AAGAATCCGG TCGACGCGGC ATGGGACGAC CAACCCGCGC CGAGCAACGC GCCGGTGAGC 
GTTTATGATA CGGCGCTCGC CGGACAGAGT GCGGTCGAGA AACGCGGTGT CATCGCCGAC 
TGGCTGAAGG CGAAGGGGCT CGACACGACG GTGATGACCG CGCTCGATTC GATCGCCTGG 
ACCTTCAATA TCCGTGGGGA GGACGTGAGC CACACGCCGG TCGGGCTGGC CTTTGCACTG 
CTCCACGCCG ACGCCACCGC CGATCTGTTC ATCGCGCCCG AAAAAATCAC CGACGCGGTG 
CGCGCGCATC TGGGCAACAG CGTGCGGATT CACGACCGCA GCGCCTTTGA AGGCGCGCTG 
GCCGGGCTTG CGGGCAAGAA AGTCGCTGTC GATCCCGACC GCGCGGTCGC GGCGATCTTT 
ACCGCGCTCG AAAACGCGGG TGTGCAGGTC GAACGGCACC GCGACCCCGC GGTGCTGCCC 
AAGGCGATCA AGAATCAAGT CGAACTGAGC GGCACGCGCG CTGCGCACCT TCGCGACGGC 
GTCGCGGTGT CGCGTTTCCT CAAATGGATG GAGGAGGTCG CGCCGCAGGG CGGCCTCGAC 
GAGCTGGGCG CGGCGGCGAA GCTGCGCGAA TTTCGCGAGG CAGGCGGCGC GCTCAAGGAT 
CTGTCGTTCG ACACCATTTC GGCGGCTGGC CCGAACGGCG CGCTGCCGCA TTACAAGGTC 
GACGAAACCA CCAACCGCAG GATCGAGAGG GGCACGCTCT ATCTGGTCGA TTCGGGCGGA 
CAATATGCCG ACGGCACGAC CGACATCACG CGCACGATCG CGATCGGGGC GCCCAGCGCC 
GAAATGCGGC GCCGCTTCAC GCAGGTGCTG AAGGGTCATA TCGCGCTGGC CACCGCGCGC 
TTTCCCAAGG GCACACGCGG CAGCCAGCTG GACATCCTCG CGCGCCAGTA TCTGTGGGCC 
GACGGGGTCG ATTATGCGCA TGGCACCGGG CATGGCGTCG GCACCTATCT CGCGGTCCAC 
GAAGGGCCGC AGCGGATCGC CAAGCCGGCG GGCGGACAGG CGGGGACCGA GGAGCCGCTG 
CACGCGGGCA TGATCCTGTC GAACGAGCCC GGCTATTACA AGGCGGGGCA TTTCGGCATC 
CGCATCGAAA ATCTGGTGAT CGTCGTGCCG CAAGAGATCG ACGGCGCCGA GGAAGAGATG 
CTGGGGTTCG AGACGATCAC CTTTGCGCCG ATCGCGAGAG ATCTGGTCGA CGTGGCGCTG 
CTGTCGTCCG CCGAGGCCGA CTGGCTCGAC GCCTATCATG CCGCGGTGTT CGAAAAGCTG 
TCGCCGGGAA TGGACGAGGC GATGCGCGAC TGGCTTGCCG CCGCCTGCGC TCCGCTCGAC 
CGCACCCCTG CCGCGCTCGC GGCCTGA

Protein sequence

MSSPVHAERL ARVRAELKAR GLDGFIVPIS DEHMSEYVGA YAQRMAWLTG FGGSAGTAAV 
LPEKAAVFVD GRYTVQVRDQ VDGSLFDYVG VPQSSVAEWL GSHVSAGQRV GYDPWLHGID 
WVRGLEKALA AKGASLVAVD KNPVDAAWDD QPAPSNAPVS VYDTALAGQS AVEKRGVIAD 
WLKAKGLDTT VMTALDSIAW TFNIRGEDVS HTPVGLAFAL LHADATADLF IAPEKITDAV 
RAHLGNSVRI HDRSAFEGAL AGLAGKKVAV DPDRAVAAIF TALENAGVQV ERHRDPAVLP 
KAIKNQVELS GTRAAHLRDG VAVSRFLKWM EEVAPQGGLD ELGAAAKLRE FREAGGALKD 
LSFDTISAAG PNGALPHYKV DETTNRRIER GTLYLVDSGG QYADGTTDIT RTIAIGAPSA 
EMRRRFTQVL KGHIALATAR FPKGTRGSQL DILARQYLWA DGVDYAHGTG HGVGTYLAVH 
EGPQRIAKPA GGQAGTEEPL HAGMILSNEP GYYKAGHFGI RIENLVIVVP QEIDGAEEEM 
LGFETITFAP IARDLVDVAL LSSAEADWLD AYHAAVFEKL SPGMDEAMRD WLAAACAPLD 
RTPAALAA