Gene Sala_0498 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0498
Symbol
ID	4081388
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	515862
End bp	517142
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	67%
IMG OID	638008856
Product	hypothetical protein
Protein accession	YP_615552
Protein GI	103485991
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATACGCA AACTTCTCGT TTTCGCCGTC GCGGCGACTC TTGCTCAGCC AGCCTTTGCT 
CAACCGTTCT GTCAAGCGGG CGCTTATCGC GGCGCCGACG GCGACTTTGT CGCGCTGGCA 
AAATCGACGG TCAATCCGGC GGGCGGGCTA CGCTATCTGT TCCGTGACGG GCGCCGCGGA 
TCGACGGGCG ATGCCGACGC GCCGCTCGAT TGCGCTCCCG ACGGCGTGCG CATTGGCAAG 
GGCGCCGAGG CGGAGACGTG GGCGCGCATC GCCCTTCGCG AAACCCCGGC GACCTTCGAC 
AGCGCGGGAT CCAAATTGTC GGGCATGTTG ATCGAACCGC CGGGCAGCGA TCCGCAGCGG 
CCGCTGGTGG TGATGGTCCA TGGCTCCGAA CGCACGTCGC CGATCGGCGG CATCTATGGC 
TATGCGATGG CGGCGCAAGG TCTGTCGGTG TTCGTCTATG ATAAACGCGG CACCGGCGCA 
TCGGAGGGCG AATATACGCA GAACTTCGAA TTGCTCGCGC GCGACGCCGC TGCGGCACTC 
GGGCAGGCGC GCGCGATGCT GCCCGGACAT GCCGGGAGGG CGGGCTTTTT CGGAGGCAGC 
CAGGGCGGGT GGGTCGCTCC GCTCGCCGCG ACGCTGACCC CCGCCGATTT TGTCGCGGTC 
GGTTTCGGCC TCGTCGCCTC GCCGATCGAG GAGGACCGCG AGCAGATGAT CTCCGAAGTG 
CGCGCGGCGG GGCTGGGCGC CGATGCCGAA GCGCTCGTTA ACCGCCTGTC GGCAGCAACG 
GCCAGGCTGC TGCTGTCGAA CTTCAAGGAT GGTTATGTCG AACTCGACGC CGCGCGCGCC 
GCGCTCGCGG ACAAGCCGTG GGCCACGCAG ATACGGGGCG AGCACAGCGG GATGATGTTG 
CGGATGTCCA ATGCTGAGCT GCGCCGGATC GGGCGGGCGC GCTTCGACAA TCTGGAACTG 
ATCTGGGATT ATGACGCGGT GGCGGCGCTG CGCCGGCTTC GCACGCCGCT CTTGTGGGTG 
CTCGCGGGCG AGGATCGGGA AGCCCCGATC GAAACGACAC GCGCCGCGCT GGCCGAATTG 
CGGGCGGCAG GGCAACCGAT CGACGTCTAT CTGTTTCCCG GCACCGACCA TGGCATGATC 
GAGTTCACGA CCGGCCCCGA CGGCAAGCGG TCCTACACGC GCATCACCGA CGGCTATCTG 
AAGCTGCTTG GCGACTGGAT GAAGGGCGAG GCGCGCGGCA CTTACGGCCG CGCCGAGACG 
CTGACGCCTA CCCCGCGCTG A

Protein sequence

MIRKLLVFAV AATLAQPAFA QPFCQAGAYR GADGDFVALA KSTVNPAGGL RYLFRDGRRG 
STGDADAPLD CAPDGVRIGK GAEAETWARI ALRETPATFD SAGSKLSGML IEPPGSDPQR 
PLVVMVHGSE RTSPIGGIYG YAMAAQGLSV FVYDKRGTGA SEGEYTQNFE LLARDAAAAL 
GQARAMLPGH AGRAGFFGGS QGGWVAPLAA TLTPADFVAV GFGLVASPIE EDREQMISEV 
RAAGLGADAE ALVNRLSAAT ARLLLSNFKD GYVELDAARA ALADKPWATQ IRGEHSGMML 
RMSNAELRRI GRARFDNLEL IWDYDAVAAL RRLRTPLLWV LAGEDREAPI ETTRAALAEL 
RAAGQPIDVY LFPGTDHGMI EFTTGPDGKR SYTRITDGYL KLLGDWMKGE ARGTYGRAET 
LTPTPR