Gene Sala_2312 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2312
Symbol
ID	4080597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	2439711
End bp	2440970
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	66%
IMG OID	638010692
Product	membrane dipeptidase
Protein accession	YP_617354
Protein GI	103487793
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2355] Zn-dependent dipeptidase, microsomal dipeptidase homolog
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAAG CCTCCTTGCT CGTCAGCCTC GCCGCGCTCG CCCTTGTTTC CAGCCCCGTC 
GCCGCCCAGA CCTCGCCCGA GGCGGTGGCC GCGGCCGCGC TCAAGAAGGC GCCGGTGTTC 
GACGGGCATA ATGACGTGCC CTGGGCGCTG CGCGCGCGCG TCGATAACGT CATCAATGAT 
TTCGATTTCG TCGACACGAC CGATACCGCG ACCGGGGACC GGATCGCGAT GCACACCGAC 
CTCACCCGGC TGCGCCGCGG GCATGTCGGC GCGCAATTCT GGTCGGTTTA CGTTCCCTCG 
ACCACCAACG AGGCGAAAGC GGTGCAGCAG ACGATCGAGC AGATCGACGT GATGAAGCGG 
CTGGTCGCGC GCTATCCCGC CGACCTGATG CTCGCCGACA ATTCCGCCGA GCTGGAAAAG 
GCGATGAAGG CGGGCAAGGT CGCCGGGATG CTGGGGATCG AGGGCGGGCA TTCGATCGGG 
TCGAGCCTGG CGGTGCTGCG CGAAATGTAT GGCATGGGCG TACGCTATAT GACGCTGACC 
CACGGCAGAA ATGTGCCATG GGCCGACAGC GCGACCGACG CACCGGAGCA TGGCGGCCTC 
ACCGATTTCG GGCGCCAGGT GGTCCAGGAA ATGAACCGCA TCGGCATGAT CGTCGATCTG 
AGCCACGTCA GCGAGGCGAC GATGAAGGAT GCGCTCGCGG CGTCGAAGGC GCCGGTGATG 
TTCAGCCATT CGGGCGTGCG CGCGATAAAC GATCATCCGC GCAATGTCCC CGACAGCGTG 
CTGCCCGCGG TGAAGGCCAA TGGCGGGATC GTGATGGTGG TGTTCCTGCC GGGCTTCCTC 
GACGCCGATG TCCGCGCGCA TGGCCTCGAC CGCACTGGCG TGGAGGCGCG GCTGAAGGCG 
ATGTATCCGG GCGATCCCGC GGCGGTTGCG GCGGCGCTCA CGGCGTGGGA CGCTGCGAAC 
CCCGCCCCGA AAACGCAGAT TGCCAGGGTC GCCGACCATA TCGACCATCT GAAACACATG 
ATCGGCGTCG ACCATATCGG ACTCGGCGGC GACTATGACG GTATGGATTC GGCGCCCGTG 
GGCATGGAGG ATGTCGCGGG CTATCCGGCG CTGTTCGTCG AGCTGGCGCG GCGCGGCTAT 
TCGCAGGCCG AGCTGGAGAA GATTGCGAGC GGCAACATGC TGCGCGTGCT GAAGGCGGTC 
GAGGCCTTTG CCGCAAGCCA GAAGGGTCAG CCGCCGGTCG AAACGCCGGT GGCGAAATAG

Protein sequence

MNKASLLVSL AALALVSSPV AAQTSPEAVA AAALKKAPVF DGHNDVPWAL RARVDNVIND 
FDFVDTTDTA TGDRIAMHTD LTRLRRGHVG AQFWSVYVPS TTNEAKAVQQ TIEQIDVMKR 
LVARYPADLM LADNSAELEK AMKAGKVAGM LGIEGGHSIG SSLAVLREMY GMGVRYMTLT 
HGRNVPWADS ATDAPEHGGL TDFGRQVVQE MNRIGMIVDL SHVSEATMKD ALAASKAPVM 
FSHSGVRAIN DHPRNVPDSV LPAVKANGGI VMVVFLPGFL DADVRAHGLD RTGVEARLKA 
MYPGDPAAVA AALTAWDAAN PAPKTQIARV ADHIDHLKHM IGVDHIGLGG DYDGMDSAPV 
GMEDVAGYPA LFVELARRGY SQAELEKIAS GNMLRVLKAV EAFAASQKGQ PPVETPVAK