Gene Sala_0456 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0456
Symbol
ID	4080945
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	467931
End bp	469769
Gene Length	1839 bp
Protein Length	612 aa
Translation table	11
GC content	63%
IMG OID	638008814
Product	peptidyl-dipeptidase A
Protein accession	YP_615510
Protein GI	103485949
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1164] Oligoendopeptidase F
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCCA TGATCTCGAC GCTGTCGCTT GCCCTGTCGC TCGCGGTGGC GAGCCCCGCC 
TTTGCGCAGG CGGCGCCCGC CGCGACTCCC GCCGCCGCCC CCACCGCCGC CGAGGCCGAA 
GCCTTTATCG CCGCGGCGGA GAAAGACCTG TTCGACTATA CCGTCGAGGC CGCCCAAGTG 
AACTGGGTCA ATGCCACCTA TATCACCGAG GACACCGACG CGATGGCGGC GCGGATCAAC 
GCGGTCGGCA CCGAAAAGGC GGTGAAATAT GCACTGGAAG CCGCGAAATA TAGCGATGTT 
CCGGGGCTGA GCGCCGAAAC GAAGCGCAAG CTCAACATCC TGCGCACGGG CCTCGTGCTG 
CCCGCGCCGA CGACGCCGGG CGCCGCGACC GAACTCAACC GGATCGCGAC CGACCTGCAG 
TCGCAATATG GCAAGGGCCG CGGCACGCTG AACGGCAAGG AAATCGCCGG TTCGGATATC 
GAGGCGGAGA TGGGCAATCT GGAACGCACC CCTGTCGAAC TCGCCGAAAT GTGGACGAGC 
TGGCACGACA ATGTCGGCGC GCCGATGAAG CAGGATTATG CCCGCATGGT CGCCATCGCC 
AACGCGGGCG CGAAGGAACT GGGCTTTGCC GACACCGGTG CGATGTGGCG GTCGGGCTAT 
GACATGCCGC CCGAAGAGTT TGCCAGGCTG ACCGAAAAAA TCTGGCAGGA CATGAAGCCG 
CTCTATGTCG CGCTCCACAC CTATGTCCGC TGGAAGCTCA ACGAGAAATA TGGCGACGCG 
GTGCAGCCCA AGACGGGACC GATCCGCGCC GACCTGCTCG GCAATATGTG GGCGCAGGAA 
TGGGGCAATA TCTATCCGCT CGTCGCGCCG CCGGGAACGG GCGATCTGGG CTATGATATC 
GGCGAGCTGC TCGCGGCGCA GGGCAAGACG CCGCTCGACA TGGTCAAGAT CGGCGAGAAT 
TTCTATTCGT CGCTGGGCAT GGCGCCGCTG CCCGATACAT TCTGGAAGCG GAGCATGTTC 
ACCAAGCCCG CCGACCGCGA AGTCGTCTGC CACGCCTCGG CGTGGAACAT CGACAACAAG 
GACGATATTC GCATCAAGAT GTGCATCAAG GTGAATGCCG ACGATTTCGT CACCATCCAC 
CACGAGCTGG GCCACAATTA TTACCAGCGC GCCTATAACC AGCAGCCGTT CCTGTATCTG 
AACGGCGCCA ACGATGGCTT TCACGAAGCG ATCGGCGATT TTGTCGCGCT GTCGATCACG 
CCGCAATATC TGGTCGACAT CGGCCTGCTC GACAAGGCGA AGGTGCCGAG CGCCGACAAG 
GACATCGGCC TCCTGCTGCG GCAGGCGATG GACAAGGTCG CCTTCCTGCC GTTCGGCCTG 
CTCATCGACC GCTGGCGCTG GGGCGTGTTC GACGGGACGA TCCAGCCCGC CGATTACAAC 
AAGGCGTGGA CCGAGATGCG CACCCGATAT CAGGGCATCG TTCCCCCGGC GGCCCGCCCC 
GCCGATGCAT TCGATGCGGG GGCGAAATAT CACATTCCTG GCAACACCCC CTATACGCGC 
TATTTCCTCG CGCGCATCCT GCAGTTCCAG TTTTACGAGG CGGCGTGCAG GCAGGCGGGG 
TGGAAGGGGC CGCTTCACCG CTGTTCCTTC TATGGCAACA GGGAGGTCGG CGCGAAGCTC 
AACGCGATGC TGGAGATGGG GGCGTCGAAG CCGTGGCCCG ATGCGCTCGA AGCCTTCACC 
GGCAAGCGCG AGATGTCGGG CAAGGCGATG GCCGATTATT TCGCACCGCT GAAAAAATGG 
CTCGACGAGC AGAACAAGGG CAAGCCGCAG GGGTGGTGA

Protein sequence

MKAMISTLSL ALSLAVASPA FAQAAPAATP AAAPTAAEAE AFIAAAEKDL FDYTVEAAQV 
NWVNATYITE DTDAMAARIN AVGTEKAVKY ALEAAKYSDV PGLSAETKRK LNILRTGLVL 
PAPTTPGAAT ELNRIATDLQ SQYGKGRGTL NGKEIAGSDI EAEMGNLERT PVELAEMWTS 
WHDNVGAPMK QDYARMVAIA NAGAKELGFA DTGAMWRSGY DMPPEEFARL TEKIWQDMKP 
LYVALHTYVR WKLNEKYGDA VQPKTGPIRA DLLGNMWAQE WGNIYPLVAP PGTGDLGYDI 
GELLAAQGKT PLDMVKIGEN FYSSLGMAPL PDTFWKRSMF TKPADREVVC HASAWNIDNK 
DDIRIKMCIK VNADDFVTIH HELGHNYYQR AYNQQPFLYL NGANDGFHEA IGDFVALSIT 
PQYLVDIGLL DKAKVPSADK DIGLLLRQAM DKVAFLPFGL LIDRWRWGVF DGTIQPADYN 
KAWTEMRTRY QGIVPPAARP ADAFDAGAKY HIPGNTPYTR YFLARILQFQ FYEAACRQAG 
WKGPLHRCSF YGNREVGAKL NAMLEMGASK PWPDALEAFT GKREMSGKAM ADYFAPLKKW 
LDEQNKGKPQ GW