Gene Sala_1031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1031
Symbol
ID	4082314
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	1065202
End bp	1066893
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	62%
IMG OID	638009391
Product	peptidase M28
Protein accession	YP_616081
Protein GI	103486520
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.418542
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTATCC CCCCCCCGCT CAAGGTCGCC GGCCTTGCCG CGCTGGCGTT GCTCGCCGCG 
TGCAACGGCA GCGCCGACCC ACAGAAAAAT GCCGCCACCG CGATCCCCGA TGTCGAGATT 
CCCCAACTAT CGCTCGCAAC CTTGCAGGAA GTAACGAGAG AATTGTCGTC CGACGCCTAT 
GAAGGGCGTG CGCCCGGCAC CGCGGGCGAA GAAAAGACCG TCGCCTACAT CATCAAGAAA 
TACAGGGAAG CGGGCTTGCA GCCCGGCAAC AACGGCCGCT GGACACAGGA CGTGCCGCTG 
GTTGAAATCA CCGCGAAGAA CGCCACCCCG CTGACCTTCA CCGGCGGCAA GACGCCCGTG 
ACGGCACAAT ATGCCAAGGA TTATGTCGCG TTCAGCTACC GCGTCCAGCC GAGGACCGAA 
GTCAAGGACA GCGACGTCGT GTTCGTGGGA TATGGCATCA ATGCCCCCGA AAAGGGCTGG 
AACGACTATG CCGGGCTGGA TGTGAAGGGC AAGACGGTCG TTGTCCTGGT GAACGATCCC 
GACTGGGAAA ACAGGGAAAC CGAAGGCCCG TTCAACGGCC GCGCCATGAC CTATTACGGC 
CGCTGGTCAT ACAAATATGA GGAAGCTGCG CGGCAGGGAG CCGCCGCCGT GCTGATCGTT 
CACGACACCG AGCCTGCCGC CTATGGCTGG AACGTCGTCG AATCGAGCAA TACGGGCACG 
CAATATCTGG CCGAAAGCAA GAATGGCGGC GCCGACCAAA CGATTGCCAA TGGCTGGATC 
CAGTTGGCCA AGGCGAAGGA ACTCTTCGCA AGCGCGGGAC AGGATTTCGA CAAGCTGCGC 
GAGGCGGCGA AACAAAAGGG GTTCAAGCCC GTGCCGCTGG CCGGGGTGAA GGCGAGCTTT 
GCCTTCGACA ATGACATCGC CAAGAAAATG TCGCGCAACG TCATCGGTGT GCTGCCGGGC 
GCCAAGCGGC CCGACGAATA TGTGCTTTAC ACGGGTCATT GGGATCATCT GGGCCGCTGC 
ACGCCCGTCG ACGGCGACGA CATCTGCAAC GGCGCGGTCG ACAATGCGAG CGGTATCGCA 
GGGCTCGTGA CGCTGGCGAA GGCGTTCAAG CAGGCGGGCG CGCCCGATCG CAGCATCGTC 
TTTCTTGCCG TCACCGCCGA GGAATCGGGC CTGCTCGGAT CGAAATACTA CGCCGAAAAC 
CCGGTCTTCC CATTGTCGCA GACGGTCGGC GGCGTGAATA TGGATGCGCT GAACGCGGTC 
GGGCCGGCGA AGGACATCGT CGTGGTCGGG GCCGGCAAGT CCGAACTTGA CGCCTATGTC 
GAGAAACTCG CCCGGATGGA GGGTCGCACG GTCAAGCCCG AACCGACCCC CGAAAAGGGT 
TTCTATTACC GGTCGGATCA TTTCAGCTTC GCCAAGCTGG GCGTCCCGAT GTTCAATTTC 
GGCAGCGGCG ACGATCTGGT CGATGGCGGC GTCGAGGCGG GTCAGAAAGC GGCCGAAGAC 
TATGAAAAGA ATCGCTATCA CGCCCCCGAC GACGAATATG AGGCGATCAC CAACTGGGAG 
GGCATGATGT CGGACCTGCG CCTCTATTAT GCGGCGGGGC GGATGCTCGC GATGACCGAT 
GCGTGGCCGA ACTGGAACGA AGGCGACGAG TTCCGCGCCG CCCGCGACAA GTCGCGCGCC 
GCAGCAAAAT AA

Protein sequence

MPIPPPLKVA GLAALALLAA CNGSADPQKN AATAIPDVEI PQLSLATLQE VTRELSSDAY 
EGRAPGTAGE EKTVAYIIKK YREAGLQPGN NGRWTQDVPL VEITAKNATP LTFTGGKTPV 
TAQYAKDYVA FSYRVQPRTE VKDSDVVFVG YGINAPEKGW NDYAGLDVKG KTVVVLVNDP 
DWENRETEGP FNGRAMTYYG RWSYKYEEAA RQGAAAVLIV HDTEPAAYGW NVVESSNTGT 
QYLAESKNGG ADQTIANGWI QLAKAKELFA SAGQDFDKLR EAAKQKGFKP VPLAGVKASF 
AFDNDIAKKM SRNVIGVLPG AKRPDEYVLY TGHWDHLGRC TPVDGDDICN GAVDNASGIA 
GLVTLAKAFK QAGAPDRSIV FLAVTAEESG LLGSKYYAEN PVFPLSQTVG GVNMDALNAV 
GPAKDIVVVG AGKSELDAYV EKLARMEGRT VKPEPTPEKG FYYRSDHFSF AKLGVPMFNF 
GSGDDLVDGG VEAGQKAAED YEKNRYHAPD DEYEAITNWE GMMSDLRLYY AAGRMLAMTD 
AWPNWNEGDE FRAARDKSRA AAK