Gene Shewmr4_2123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_2123
Symbol
ID	4252696
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	2533569
End bp	2535632
Gene Length	2064 bp
Protein Length	687 aa
Translation table	11
GC content	49%
IMG OID	638118747
Product	peptidase S9 prolyl oligopeptidase
Protein accession	YP_734253
Protein GI	113970460
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000494152
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATATAA CAATGAAAAT AGCTCCTCTC CTATTGGCGC TTGGCGCGGC TGGTTTGGCC 
TGCTCAGCCC ACGCGGCCGA TCCTAAGCCT TTTACTGTGC AACAGCTGGT TAAACTCAAC 
AAATTGCATT CAGCCGCGGT GTCCCACGAC GGCACAAAAT TGGTCTACGG CCTGAAAACC 
GTTAATGACA AGGGAGAGGC GAGCTCAGAT TTATATATTC TCGATTTGAC GCAAGCGGAC 
GCGAAACCGA TGCAGATCAC TTCTGCAGCG GGTACTGAGC ACGATGTCAG CTTCGCAAAC 
GATGACAAAT CGATTTATTT CCTCGCCAGC CGCAGTGGTT CAAGCCAACT GTTCCAACTG 
CCATTAACGG GCGGTGAAGC GCAGCAAGTT TCTGATCTGC CATTGGATAT TGATGGTTAC 
AAACTCTCTA ACGATGGTAA GCAAATCGTG CTCAGCATGC GTGTTTTCCC CGAGTGTAAA 
GACTTAGCTT GTTCAAAAGA CAAATTTAAG GCCGAAGAAG AGCGTAAATC GACGGGCCGT 
GAATACAAGC AGTTGATGGT GCGTCACTGG GATACCTGGG AAGATCATGC CCGTAACCAC 
TTATTTGTGG GTGCCCTTAA TGGCGAGAAG CTGACCAAAG TGGTGGACAT CACCCAAGGT 
TTAGACACAG AAACCCCACC TAAGCCATTC TCAGGCATGG AAGAAGTGTC CTTCACTCCT 
GATGGCAAAT ATGTGGTGTA CAGCGCCAAA GCGCCAAGCA AAGATCAAGC TTGGACGACA 
AACTACGATC TGTGGCAGGT GAGTGTAAAC GGTGGAAAAG CCACTAACTT AACCGCCGAT 
AACATCGCTT GGGACGCCCA GCCAATATTC TCAAGCGATG GTCGCTATAT GGCGTACCTC 
GCGATGACTA AACCCGGCTT CGAAGCTGAC CGTTACCGCA TTATGCTGCG TGATACTAGC 
ACTGGACAGT CGAAGGAAGT GGCACCGCTG TGGGACAGAA GCCCAAGCTC GCTGATGTTT 
GCACCAGACA ACCGTACTCT GTATGTGACG GCTCAAGACA TTGGTCAAGT GTCTATTTTC 
AAAGTGAATA CTCAGTTTGG TGATGTGCAG TCTGTCTACA GCGACGGCAG CAATAGCCTG 
ATTGCGATCG CCGACGATCA ACTGATCTTC GACAGCAAAA CCTTAGTTGA GCCGGGCGAT 
CTGTACCGCA TCAACACCGA CGGCCAAGGC CTGAAACGTC TGACTGAAGT TAACAAAGAC 
AAACTGGCCG AAATCAAATT CGGTGAATTC CAACAATTTA GCTTTAAGGG TTGGAACAAC 
GAAGATGTTT ACGGTTACTG GATCAAACCT GCCAACTACC AAGAAGGCAA AAAGTATCCG 
ATTGCATATC TAGTCCACGG TGGTCCGCAG GGGTCATTTG GTAACGCCTT CAGTGGTCGT 
TGGAACGCCC AGTTATGGGC TGGCGCGGGT TATGGCGTTG TGATGGTGGA CTTCCACGGT 
TCAACTGGTT ACGGCCAAGC CTTTACCGAT TCTATCAGCC AAGATTGGGG TGGTAAGCCA 
TTAGAAGACT TACAAAAAGG TCTGGCAGCG GTGAGCCAAC AACAAAAATG GCTCGATCCA 
CAAAATGCCT GTGCATTGGG CGGCTCTTAC GGCGGCTACA TGATGAACTG GATCCAAGGC 
AACTGGAACG ATGGCTTTAA GTGCCTCGTT AACCACGCGG GTCTGTTCGA TATGCGCTCT 
ATGTACTATG TGACCGAAGA AGTATGGTTC CCAGAGCATG AGTTTGGTGG CACTTACTCA 
GATAACAAAG CCTTATATGA GAAGTTTAAC CCAGTAAACT ATGTGGAAAA CTGGAAAACG 
CCAATGTTGG TTATCCATGG CGAGAAGGAC TTCCGTGTGC CTTATGGTCA AGGTTTAGCC 
TCATTTAGCT ATATGCAACG CAAGGGAATT CCATCAGAGC TGCTGATTTT CCCTGATGAA 
AACCACTGGA TCTTAAAGCC TGAAAACCTC GAACAATGGT ACGCGAACGT GTTCCGTTGG 
ATGGACAGCT GGACGAAAAA GTAA

Protein sequence

MDITMKIAPL LLALGAAGLA CSAHAADPKP FTVQQLVKLN KLHSAAVSHD GTKLVYGLKT 
VNDKGEASSD LYILDLTQAD AKPMQITSAA GTEHDVSFAN DDKSIYFLAS RSGSSQLFQL 
PLTGGEAQQV SDLPLDIDGY KLSNDGKQIV LSMRVFPECK DLACSKDKFK AEEERKSTGR 
EYKQLMVRHW DTWEDHARNH LFVGALNGEK LTKVVDITQG LDTETPPKPF SGMEEVSFTP 
DGKYVVYSAK APSKDQAWTT NYDLWQVSVN GGKATNLTAD NIAWDAQPIF SSDGRYMAYL 
AMTKPGFEAD RYRIMLRDTS TGQSKEVAPL WDRSPSSLMF APDNRTLYVT AQDIGQVSIF 
KVNTQFGDVQ SVYSDGSNSL IAIADDQLIF DSKTLVEPGD LYRINTDGQG LKRLTEVNKD 
KLAEIKFGEF QQFSFKGWNN EDVYGYWIKP ANYQEGKKYP IAYLVHGGPQ GSFGNAFSGR 
WNAQLWAGAG YGVVMVDFHG STGYGQAFTD SISQDWGGKP LEDLQKGLAA VSQQQKWLDP 
QNACALGGSY GGYMMNWIQG NWNDGFKCLV NHAGLFDMRS MYYVTEEVWF PEHEFGGTYS 
DNKALYEKFN PVNYVENWKT PMLVIHGEKD FRVPYGQGLA SFSYMQRKGI PSELLIFPDE 
NHWILKPENL EQWYANVFRW MDSWTKK