Gene Sala_2389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2389
Symbol
ID	4080542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	2521467
End bp	2523137
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	70%
IMG OID	638010769
Product	leucyl aminopeptidase
Protein accession	YP_617431
Protein GI	103487870
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0260] Leucyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0738051
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAGCC GATGTCGTTC GTCGAGCCCG ATTTGCGGAC GGGCTGGAGG CAGCTATGCA 
GGACGCAGGT CGTCAAACAA CGGGGATTAT CGAACGATGC GCATGAAAAC ACTGCTTCTT 
TCCGCTTGCC TGTCGCTCGC CTTCACGCCC GGCGCGATGG CGCAAACCGT GATCGGGTCG 
GGCGTTGTCC CGGCGAACGC CGCGAACAGC GCCGAACGCG CGATCGGCTT CGCATCGCGC 
GCGCCGACGG GCGCCGCGCT CGTCATTGTG ATGACCGACG CCGCGCTGCC GCCGCTCGAT 
GGCGTCGCGC TCTCCGCGCC CGAGCGGCAG GCAGTCGAGG CCGCGATCGC CGCCGCGAGC 
TTCGACGGCA AGGCGGAATC GACGCTGTCG CTGCGCGGCA TCGGCGCGCA TCCGCGCATC 
CTGCTCGTCG GCGCCGGGCC GGCGCCCTCG TCGCTCGCGC TCGCCGAAGC GGGCGGCAAG 
GCGGCGCAGG AGATGAAGGG CGAGGCGCAT CCCGTGGCGA TCGCCGGCGC CTTTGGCGAC 
ACCTCCGCCG CCGAGGTCGC TTATGGCTTC GCGCTCGGCC AATATCGTTT CGACCGCTAC 
AAGACGGTCG ACCGCAAGAC GCCGCCCTCC GCCGCGGTCA CGCTCGTCGG CGCCAATCCC 
TCGACCGCCG AGACCGCCTT TGCGACGCGC TGGCAGCCGC TCGTCGACGG CGTGCGCCTG 
TCGCGCGATC TGGCCAACGA GCCCGCGAAC GTCATCTACC CCGAAAGCTT CGTTGCGCGC 
GTGCGTGCGG CGTTCGCGGG CGTTCCGGGC GTCAGCATCG AGGTGCTCGA CGAAGCGGCG 
ATGCGGCGGC TCGGCATGGG CACGCTCGTC GGCGTGGGCC AGGGCAGCCC GCGCGGCTCG 
CGCCTGCTCG CGGTGCGCTA CCGCGGCGTG GGTGCGCCCG CCGCACCGCT GGCGTTCGTC 
GGCAAGGGCA TCACCTTCGA TTCGGGCGGC ATTTCGCTCA AACCCGGCAC GGGCATGTGG 
AACATGAAGG GCGACATGTC GGGCGCCGCG TCGGTCGTCG GCGCGGCGCT GTCGCTCGCC 
AAGTCGCGCG TGCCGGTGCA TGTCGTCGCG GTCGCGGCGC TTGCCGAGAA TATGCCCGAC 
GGCAACGCGC AGCGTCCGGG CGACGTCGTG CGCACCCTGT CGGGCAAGAC GATCGAGATG 
CTGAACAGCG ACGCCGAGGG CCGCCTCGTC CTCGCCGACG CTAATGAATA TGTCGCGCGC 
GAATATAAGC CGCGCGCGAT CGTCAATATC GCGACGCTCA CCGGGTCGAT CGTCGGTGCA 
CTCGACGACC GATATGCGGG CCTCTTTTCG CGCGATGACG AGCTTGCCGC CGCGCTGCTC 
GCCGCCGGAA CCGCCAGCGG CGAGGAGCTG TGGCGGATGC CGCTGCACCG GGATTATGCC 
GACAAGCTCA AATCGGACAT CGCCGACATC CGCAACATCG CGGCGGGCCA GGGGCCGGGC 
GCGAGCCTCG GCGCGCATTT CATCGGCTTC TTCGTCGATG AGGACATGCC ATGGGCGCAT 
CTCGACATCG CAGGCGTCAA CCGCAGCGAA TCGGCAAGCC CGCTCGTGCC TAGGGGGATG 
ACGGGCTTCG GCGTGCGTCT GCTCGACCAG CTGGCGCGCG GCGGGGAGTA G

Protein sequence

MASRCRSSSP ICGRAGGSYA GRRSSNNGDY RTMRMKTLLL SACLSLAFTP GAMAQTVIGS 
GVVPANAANS AERAIGFASR APTGAALVIV MTDAALPPLD GVALSAPERQ AVEAAIAAAS 
FDGKAESTLS LRGIGAHPRI LLVGAGPAPS SLALAEAGGK AAQEMKGEAH PVAIAGAFGD 
TSAAEVAYGF ALGQYRFDRY KTVDRKTPPS AAVTLVGANP STAETAFATR WQPLVDGVRL 
SRDLANEPAN VIYPESFVAR VRAAFAGVPG VSIEVLDEAA MRRLGMGTLV GVGQGSPRGS 
RLLAVRYRGV GAPAAPLAFV GKGITFDSGG ISLKPGTGMW NMKGDMSGAA SVVGAALSLA 
KSRVPVHVVA VAALAENMPD GNAQRPGDVV RTLSGKTIEM LNSDAEGRLV LADANEYVAR 
EYKPRAIVNI ATLTGSIVGA LDDRYAGLFS RDDELAAALL AAGTASGEEL WRMPLHRDYA 
DKLKSDIADI RNIAAGQGPG ASLGAHFIGF FVDEDMPWAH LDIAGVNRSE SASPLVPRGM 
TGFGVRLLDQ LARGGE