Gene Shewmr4_2104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_2104
Symbol
ID	4252677
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	2509396
End bp	2511489
Gene Length	2094 bp
Protein Length	697 aa
Translation table	11
GC content	49%
IMG OID	638118728
Product	prolyl oligopeptidase
Protein accession	YP_734234
Protein GI	113970441
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1505] Serine proteases of the peptidase family S9A
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.258358
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.949573
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCGTA AATTACTGCC TTGGTGCATC GCAGGGGTAC TCACTATGAG TGGTCAACTC 
CACGCCGAAG AAGACAAATA CCTTTGGCTT GAAGAAGTTG AAGGCGCAAA GCCGATGGAG 
TGGGTTAAGG CCCAAAATGC CACTTCTGCC GCTGAAATTA AAGCCTTCAA AGGCTTCGAT 
ACCTTAGTAG CCAACAGCCT TGCTATCCTC AATGACAAAG AGCGTATTCC TTACGCCACC 
CATATTGGCG ATAAGCTGTA TAACTTCTGG AAGGATGATA CCCATGTGCG GGGGATTTAC 
CGTCGCACTA CGATGGAAGA ATACGCCAAG GCGGATCCAA AGTGGGAAAC CGTGCTCGAT 
GTCGATGCCT TAGGCAAAAC CGAAGCGGTG AACTGGGTGT TCAAAGGCAT TGATTGCCAG 
TATCCACAGA ATCAGCGCTG CTTTGTGTCC TTATCCCGTG GCGGCGCCGA TGCGGTCGAA 
GTGCGTGAAT TTGATTTAAC CACCAAAGAC TTTGTGCCTG CGAAAGACAA ACCTTTCTTC 
TTAAAAGAAG CGAAATCTAG CCTTAGTTGG ATTAATACCG ATCAGGCATT TGTCGGTACC 
GATTTTGGCG ATGGCCAAAG TATGACGGAC TCGGGCTATC CCCGCGTGGT AAAGTTATGG 
CAACGTGGTA CGCCGCTTGA GCAAGCGAAA ACCATTTTCA GTGGCGACAA AACTTCGGTC 
GCGGTATCGG GTTGGGTGAT ATTTGACGAT AAAACCCCAC TGAGCCTAGT CACCGAGGCG 
CATACCTTTT ACACCGCTAC TCAATATGTT TACCAAGACG GCAAACTCAT AAAGCTGCCA 
CTCCCACAGG ATGCCGAGAT TAAAGGCTAT TTCCAAGGCA AGTTGTTTAT TGAGCTTAAG 
AGTGAGTTAG CAACCCCTGC GGCGACATTC AGCCAAGGCG CAGTGGTGTA CGCTAATGTG 
GCGGATTTGA TTGCCCAAAA AGCCGCCTTT ACTGAATTTG TCAGCCCAAC GCCGACCGCA 
TCAATCGCCC AGTTAACGTT CAGTAAGAGC GCAATTTTTG TTAATTGGCT CGATAACGTG 
AAAAGCAAAC TGGTTCGCTA TGAGCAAGAC GCGAAAGGCG CATGGCAAAG CACGCCCGTA 
CCCTTTGAGG CCAATGGCGC GCTAACCGTG ATGGATATGG AGCGTGACAG TGATGATTTC 
TTTGTCAATT ACACGAGTTT CCTTGAACCA TCGAGCCTGT ATACCGTCAA TGCTAAGGCG 
CTAAAACCGC AAAAAATGAA AGGTATGCCT CAGCAATTTG CGGCGGATAA ATTTACCACC 
GAGCAGTATT TTGCAACCTC AAAGGATGGC ACTAAAGTGC CGTATTTTGT GGTGATGGCA 
AAAGATCTTA AGCTCGATGG CAGTAATCCA ACACTGCTTT ATGGTTATGG TGGTTTTGAA 
GTGTCACTGC GCCCAGCCTA TTCTGCAACC ATTGGTAAAA ACTGGTTAGA GCAGGGCGGC 
GTGTATGTGC TGGCGAATAT CCGTGGTGGC GGCGAGTATG GGCCTGCGTG GCATCAAGCG 
GCGCTTAAGG AAAATCGTCA TAAGGCTTAC GAGGACTTTG AAGCCATCGC CGAGGATCTC 
ATTGCCCGTA AGATTACCTC GAGCAAGCAC TTAGGTATTC AAGGTGGCAG CAATGGTGGT 
TTGCTGATGG GCGCCGCTTT TACCCGCCGT CCCGATCTCT ACAATGCCGT GGTCTGCCAA 
GTGCCGTTAC TCGACATGTA CCGCTTCAAT AAGTTACTCG CCGGCGCAAG TTGGATGGGG 
GAATACGGAA ATCCCGATGT TCCAGAGGAA TGGGCTTACA TTAAAACTTA TTCGCCATAC 
CATAATCTGC ACAAGGATAC GCATTATCCA AAGGTGTTCT TCACCACCTC AACCCGTGAT 
GACAGGGTTC ACCCAGGACA CGCGCGTAAG ATGGTGGCCA AGATGAAGGA CATGGGTATC 
GATGTGCTTT ACTATGAAAA TATCGAAGGT GGGCATGCTG GGGCTGCAGA TAATAATCAA 
GCTGCGGAAC TAAATTCAAT GGCGTTTGCC TACTTATTAC AGCAGTTAAA ATAA

Protein sequence

MNRKLLPWCI AGVLTMSGQL HAEEDKYLWL EEVEGAKPME WVKAQNATSA AEIKAFKGFD 
TLVANSLAIL NDKERIPYAT HIGDKLYNFW KDDTHVRGIY RRTTMEEYAK ADPKWETVLD 
VDALGKTEAV NWVFKGIDCQ YPQNQRCFVS LSRGGADAVE VREFDLTTKD FVPAKDKPFF 
LKEAKSSLSW INTDQAFVGT DFGDGQSMTD SGYPRVVKLW QRGTPLEQAK TIFSGDKTSV 
AVSGWVIFDD KTPLSLVTEA HTFYTATQYV YQDGKLIKLP LPQDAEIKGY FQGKLFIELK 
SELATPAATF SQGAVVYANV ADLIAQKAAF TEFVSPTPTA SIAQLTFSKS AIFVNWLDNV 
KSKLVRYEQD AKGAWQSTPV PFEANGALTV MDMERDSDDF FVNYTSFLEP SSLYTVNAKA 
LKPQKMKGMP QQFAADKFTT EQYFATSKDG TKVPYFVVMA KDLKLDGSNP TLLYGYGGFE 
VSLRPAYSAT IGKNWLEQGG VYVLANIRGG GEYGPAWHQA ALKENRHKAY EDFEAIAEDL 
IARKITSSKH LGIQGGSNGG LLMGAAFTRR PDLYNAVVCQ VPLLDMYRFN KLLAGASWMG 
EYGNPDVPEE WAYIKTYSPY HNLHKDTHYP KVFFTTSTRD DRVHPGHARK MVAKMKDMGI 
DVLYYENIEG GHAGAADNNQ AAELNSMAFA YLLQQLK