Gene Shewmr4_2589 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_2589
Symbol
ID	4253160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	3083745
End bp	3085778
Gene Length	2034 bp
Protein Length	677 aa
Translation table	11
GC content	51%
IMG OID	638119224
Product	peptidase S9 prolyl oligopeptidase
Protein accession	YP_734717
Protein GI	113970924
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.00363766
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGGTTAG GACGCTATTT ACCATATCTG CTGAGTGCAG TTTTACTGCT TGGTGGGTGT 
GAGCGTACGG ATACACAAGA TTCAAGTGCC AAGGAAAACG GCGATATAAA AGTTGCCCCC 
TATGGCAGCT GGCAATCACC TCTGTCTGCA GCCGAGGTGT TTGAACGGGC CGATGATATT 
GCTGAGCTGC AAAGCGTCGG CAATGCGATT TATTTTGCTG AATCCAGTGG CAGCGCACAG 
GGCAAAGTCG GCATTAAGCG CCTCGATGGC GTTGGTAAAG TGACTGAAGT CGTTCCCCCT 
GATTTTAATG TCAAATCTAC CGTGCATGAG TATGGTGGCG CGGCATTTTT GGGCATAGGC 
CAGAGCCTAT TTGCCACTAA ACTACAGGAT CAGCTGTTTT ACCGTTTCGC CCCGAATCAG 
CCGCCATTGC CCTTAACCCC CAATGGTACC CGCCATGCCG ATTGCGTGGC GTACCCTAAG 
GGCTCGCGGA TTATTTGTGT GCGTGAAGAC CACCGTCAGG GCGGCGAACC TAAAGCCAGC 
TTAGTGACCA TCAATCTTAA CTTTGCTGGT GAAGGCGATA CCTTTGTCAG TGGCCATGAC 
TTTATTTCCT CTCCCACGAT TTCCCCCGAT AACACGCAAT TGGCGTGGAT CACCTGGGAA 
CATCCCTATA TGCCTTGGGA TAACAGCGTG CTCTGGCTTG GGGATCTTGA CCGCAAAGGC 
CAGTTAAAAA ATATTCGTAA GGTGAATACG CCCAAGGATT CTTCGGTGAC TCAGCCCTTA 
TTCGGCCCCG ACGGCAACTT ATATGTGGTG TCCGATCTCA GTAACTGGTG GAATATTTAC 
CGCGTCACCC CAAAAGAAAC CTTAAAGCCG GTACTGAGTA AAAATGCCGA GTTTGCCGTG 
CCCGATTGGC GCTTAGGCAA TCATAACTAT GCCTTTGAAA ATGCCTCGAC CTTGATTGCC 
AGCTATGTTG AAGGTAATCA GGCGGCATTG CTGCGTATGC ACTTAGATTC GGGATTGACC 
GAATCCCTTG CCGTTGATTT TGCTGAGATT ACTCAGGTGG TGAAGGGCGA AGATGGGGTT 
TATTTTGTCG GCGCTAAGGC GACGCCAGAG AAGGGTATTT ATCGGGTTGT CGGCCGTGGC 
ACTGAGTTAG TCTATGCGCC AGCGCTGCCG AATCTTGACC CTAACTATGT GTCGCGGGCG 
AGAAATATCG CCTTCAATAC GGGCAAAAAT CAGCAGGCTT ACGGTTATTT TTATGGTCCG 
GTGAATCCCA ATTACATTGC GCCCCATGAT ACAAGGCCGC CGCTTATCGT GATGTTACAT 
GGCGGGCCGA CGGCGCGCGC TTCCCTTGCC TATCGCAGTG AAATCCAGTT TTGGACCAGC 
CGTGGGTTTG CGGTGCTGGA TTTAAACTTT CGTGGTAGCA GTGGCTTTGG CCGCGCCTAC 
CGCCAGAGCT TATATGGCAA ATGGGGGGAA AGCGATGTGG AAGATGCGGT CAATGCGGCC 
AAGTATTTAG TGACTAAGGG CTGGGTCGAT GCGAAAAAAC TGGCGATCCG CGGGATCAGT 
GCTGGCGGCT TAACCGCCAT GTCCTCCCTA GCGTTTTACG ATGTGTTTCA GGCGGGGGTG 
AGCTATGAGG GGATCAGTGA TTTTGAACAG CTCGCTAAGG GCACCCATAA GTTTGAGTCG 
GGCTATTTAG ATCAGCTTAT TGGCCCCTAT CCAGAGCTGA AACAACGTTA TCGCGAGTTA 
TCGCCACTCA ATCACTTAAA TGGTTTAAAT GAACCCTTGC TGATTTTCCA AGGTTTGAGA 
AACAAGATAG TGCCGACGGC GCAGTCGCGG CAAATTTATG ATGCGCTGAA AGCCAAAGGC 
GTACCGACGG CCTATATCGA TTATGGTGAT GATTCCGACG AGGGGCGCAC ACCTGAGCAT 
AAAGCCGCGG GGTTAGAGAC CGAGTTAGCC TTCTATGGCC AAGTGTTTAA GTTTACCCCT 
GCGGGTAAAC TGCCCAAATT AACCCTAGAT AATGCGATGG CGCTAAAGCA CTAG

Protein sequence

MGLGRYLPYL LSAVLLLGGC ERTDTQDSSA KENGDIKVAP YGSWQSPLSA AEVFERADDI 
AELQSVGNAI YFAESSGSAQ GKVGIKRLDG VGKVTEVVPP DFNVKSTVHE YGGAAFLGIG 
QSLFATKLQD QLFYRFAPNQ PPLPLTPNGT RHADCVAYPK GSRIICVRED HRQGGEPKAS 
LVTINLNFAG EGDTFVSGHD FISSPTISPD NTQLAWITWE HPYMPWDNSV LWLGDLDRKG 
QLKNIRKVNT PKDSSVTQPL FGPDGNLYVV SDLSNWWNIY RVTPKETLKP VLSKNAEFAV 
PDWRLGNHNY AFENASTLIA SYVEGNQAAL LRMHLDSGLT ESLAVDFAEI TQVVKGEDGV 
YFVGAKATPE KGIYRVVGRG TELVYAPALP NLDPNYVSRA RNIAFNTGKN QQAYGYFYGP 
VNPNYIAPHD TRPPLIVMLH GGPTARASLA YRSEIQFWTS RGFAVLDLNF RGSSGFGRAY 
RQSLYGKWGE SDVEDAVNAA KYLVTKGWVD AKKLAIRGIS AGGLTAMSSL AFYDVFQAGV 
SYEGISDFEQ LAKGTHKFES GYLDQLIGPY PELKQRYREL SPLNHLNGLN EPLLIFQGLR 
NKIVPTAQSR QIYDALKAKG VPTAYIDYGD DSDEGRTPEH KAAGLETELA FYGQVFKFTP 
AGKLPKLTLD NAMALKH