Gene Swit_4410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Swit_4410
Symbol
ID	5200357
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingomonas wittichii RW1
Kingdom	Bacteria
Replicon accession	NC_009511
Strand	+
Start bp	4859823
End bp	4860788
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	68%
IMG OID	640583962
Product	proline iminopeptidase
Protein accession	YP_001264886
Protein GI	148557304
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID	[TIGR01249] proline iminopeptidase, Neisseria-type subfamily

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.34926
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGCAC TGTCGACCCA GCTATATCCG CCGATCGAGC CCTATGCGAG CGGGATGCTC 
GACGTCGGCG ACGGCCACGG CATCTATTAT GAGCGGGTGG GGACGCCGGG CGCGAAGCCG 
GCGGTGTTCC TGCACGGCGG GCCGGGGGCG GGCTGCTCGC CCGATCACCG GCGACTGTTC 
GATCCGGCGC GCTATGACCT GCTGCTGTTC GACCAGCGCG GCTGCGGGCG ATCGGCGCCG 
CATGCCGAGC TGACCGCCAA CACGACCTGG CACCTCGTCG CCGATATCGA GCGGCTGCGG 
GCGATGGCGG GCGTCGAGGC GTGGCTGGTG TTCGGGGGAA GCTGGGGGTC GACGCTGGCG 
CTCGCTTATG CGGAGACGCA CCCCGAGCGG GTCAGCGAAC TGGTGCTGCG CGGCGTCTAC 
ACGGCGACGC GGGCCGAGAT CCAATGGTAT TACCAATGGG GCGTGTCGCA GATGTTCCCC 
GATAAGTGGG AGCGCTTCGT CGCGCCGATC CCCGAGGCCG AGCGCGGCGA CATGGTCGCG 
GCCTATAATC GCCGGCTGAC CGGCACCGAC CCCGCCGCGC AGATCGAGGC GGCGAAGGCC 
TGGAGCCTGT GGGAGGGCGA GACGATCACG CTGCTGCCGA GCGCGGCGCT GACCGACCAG 
CATGGCGACG ACCATTTCGC GATCGCCTTC GCGCGGATCG AGAATCATTA TTTCTTCCAC 
GACTGCTGGC TGGAGCCGGA CCAGTTGCTG CGCGACGCCG GGCGGCTGCG CGGCATCCCC 
GGCGTGATCG TCCACGGCCG CTACGACATG CCCTGTCCGC TCCATCATGC CTGGGCCCTG 
CACAAGGCCT GGCCCGAGGC CGATTTCCAC CTGATCGAGG GGGCCGGCCA TGCCTATTCG 
GAGCCGGGCA TATTGGAACA ATTGATAAAG GCGACCGATC GCTTCGCGGG GAGAGGGCAG 
GAATGA

Protein sequence

MSALSTQLYP PIEPYASGML DVGDGHGIYY ERVGTPGAKP AVFLHGGPGA GCSPDHRRLF 
DPARYDLLLF DQRGCGRSAP HAELTANTTW HLVADIERLR AMAGVEAWLV FGGSWGSTLA 
LAYAETHPER VSELVLRGVY TATRAEIQWY YQWGVSQMFP DKWERFVAPI PEAERGDMVA 
AYNRRLTGTD PAAQIEAAKA WSLWEGETIT LLPSAALTDQ HGDDHFAIAF ARIENHYFFH 
DCWLEPDQLL RDAGRLRGIP GVIVHGRYDM PCPLHHAWAL HKAWPEADFH LIEGAGHAYS 
EPGILEQLIK ATDRFAGRGQ E