Gene Sala_2359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2359
Symbol
ID	4080760
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	2484997
End bp	2486178
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	68%
IMG OID	638010739
Product	peptidase M19, renal dipeptidase
Protein accession	YP_617401
Protein GI	103487840
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2355] Zn-dependent dipeptidase, microsomal dipeptidase homolog
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.160596
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCGCT GGTTGATCGC CCTTTTGATC GTCGTCGCGC TGGCCGCGCT CGCCTTTTTC 
ACGCTCGCGC CGGGGATGAT CGAGCGCGAC CTCAACCGGA TCGACGGCAA GCCGCTGCCG 
CAGGTGACGG CGCGCGCAGA GGCGCTGCAC CAGACGCTCA CGATCGTCGA TCTGCACAGC 
GACAGCCTGT TGTGGAGCCG CGATTTCCTG GATCGCGCCG AGCGCGGCCA TATGGACCTG 
CCGCGGCTGA AGGACGGCCA TGTCGCGCTG CAGGTGCTCG CGAGCACGAC CAAATCGCCC 
AAGGGGCAGA ATTACCACGC GAACGGCGCC GACAGCGACA ATATCACCGG CCTCGTGATC 
GCGCAGCTCC AGCCGGTGCG GACGTGGACC TCGCTGCTCG AACGCTCGCT CTGGCACGCC 
GAAAAGCTGC ACCGCGCGGC CGCGGCGTCG AACGGCACGC TGAAACCCGT CGCGACCACC 
GCCGACCTCG ACGCGCTGCT CGCCGCGCGG CGCGGCAAGC CGCTCACCAC CGGCGCGCTG 
CTCAGCGTCG AGGGGCTGCA CAATCTCGAA GGCGACATTG CCAATCTGGA CAAGCTCTAC 
GCCGCGGGCT TCCGCATGGC GGGGCTCACC CATTTCTTCG ACAATGAACT CGCAGGCTCG 
ATGCACGGGC TCAAGAAAGG CGGGCTCACC CCGCTGGGGC GGCAGGTCGT GACCGCGATG 
GAGGCGAAGG GCATGATCGT CGACATCGCG CATTGCAGCG AGGCCTGCGT CGCCGACATA 
TTGAAAATGG CGCGCCGCCC CGTCGTGTCC AGCCACGGCG GGGTGCAGGC AACGTGCAAG 
GTCAACCGCA ACCTGTCGGA CGCGCAGATT CGCGGCGTCG CCGCAACCGG CGGCCTCGTC 
GGCATCGGTT ACTGGGACGC CGCGGTGTGC GACACCTCGC CCGCGAGCAT CGCGCGCGCG 
ATGAAGCACG TCCGCGACCT CGTCGGCATA AATCATGTCG CGCTCGGCAG CGATTATGAC 
GGCGCCACCA CCGTGCGCTT CGACACCGCG CAGCTGGTGC AGGTGACGCA GGCGCTGATC 
GACGCGGGCT TTTCCGACGA CGAAATCCGC GCCGCGATGG GCGGCAATGC GATCCGCGTG 
CTGAAAGCGG GGCTGGTGCC CCTCACGCCG CCGGCGCCAT GA

Protein sequence

MRRWLIALLI VVALAALAFF TLAPGMIERD LNRIDGKPLP QVTARAEALH QTLTIVDLHS 
DSLLWSRDFL DRAERGHMDL PRLKDGHVAL QVLASTTKSP KGQNYHANGA DSDNITGLVI 
AQLQPVRTWT SLLERSLWHA EKLHRAAAAS NGTLKPVATT ADLDALLAAR RGKPLTTGAL 
LSVEGLHNLE GDIANLDKLY AAGFRMAGLT HFFDNELAGS MHGLKKGGLT PLGRQVVTAM 
EAKGMIVDIA HCSEACVADI LKMARRPVVS SHGGVQATCK VNRNLSDAQI RGVAATGGLV 
GIGYWDAAVC DTSPASIARA MKHVRDLVGI NHVALGSDYD GATTVRFDTA QLVQVTQALI 
DAGFSDDEIR AAMGGNAIRV LKAGLVPLTP PAP