Gene Sbal223_4124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_4124
Symbol
ID	7088447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	4892661
End bp	4894598
Gene Length	1938 bp
Protein Length	645 aa
Translation table	11
GC content	45%
IMG OID	643463003
Product	peptidase S9 prolyl oligopeptidase active site domain protein
Protein accession	YP_002360018
Protein GI	217975267
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAGGA TTTTACCGCT GCTTTTTATG TGGCTATGCA ACCATGCCGT CGCCGACACC 
GCCCCACAAT TACCCGTTGA AGCCTTTGCC AGCATCCCAG ATGTGAGCTC TGTGCAACTC 
TCGCCTAACG GCAAAAAACT CGCATCAGTT GTACGCGTCG ACCAAGCCAA ACTCAAAGGT 
ACTGTCGTTA GTATCCAAGA TATAGAAACA GGCGAAAAAA GCATTCCTCT ACACACAGAT 
AATCAAAAAT TTGTCATCCT GTCTCTGCAG TGGGCAAACG ATAATATCTT ACTGATCAGT 
GCCAAGTTTC CGGCTAACCG TTACGGTACA CCGACAACCG AAACCCGCCT TGTTAAGTAT 
GATTTGACCA CGAAAAAGAC CTCGAGTGTC ATTCCGCGCA GTGTCTTAGA TCGTCTCAAT 
TGGATCCCGC AACATCAGGG GCAAATTATC GATCTTATGG CAGATGATCC CGACAATATT 
TTACTGTCAT TAGACGGAAT GGGCGAAAAC GTAGGCGAAG ATAGTGTACT GAAAGTCAAT 
TTAGCGCAGG GTAAATCCAG TTACACCCAA AGTGCTAAAA AGAAGATCAT CAGTTGGATT 
ACTGACAGGC AACACAAGGT CCGTATTTCT ATCTATAACG ATGATACTGA GTACCGCATT 
TATGAACAGG CCGAGCAAAA GAGAGATTCA CGCTTACTTT GGACCTTTAA AGCCTTTTCA 
GAAGACAGTG TTTGGCCATT AGGTTTTGAT GCTGACCCCA ATATTCTTTA CGTTCGCGCC 
TATCACCAAG GTTTCGAAGC CATATTTAAA GTCAATCTGA CCGATCCTAA GCTCACAAAA 
GAGTTGGTCT ACGCCAATGA AGATACTGAC GTTGAAGGTA ATTTACTCTA TTCGAAACTG 
AAGAAAAAAG TGATTGGTAT CAGTGAAGGT GACGGCGAAG AATACACCTT TTGGGAAAAA 
GAATATGTGG GCCTACAAAA TGGCCTAAAA GCCGTGTTAC CCAACGCACA CAACTATATT 
ACTCAGTTCA GTGCCGATGA ACGCCGCTAC ATAGTGTATT CCACTAGCTC GACCGAGCCC 
GGCACTTACT ATTTTGGCGA TAGGGACGAA AAAACGCTTT ATCCAATCGC TAACCGATAC 
GGCAGACTTA AGAGTGAACT CCTCGCCGAT ACCCAATATT TAACTTATGA GGCAAGGGAT 
AAGCTCAAAA TCGATGCTTA CCTAACCGTG CCAAAAGGTC TTGAAGCCAA GCAACTGCCG 
ACGATTATTT TCCCCCATGG CGGCCCCATC AGTTACGACA GCAACGACTT CGACTACTGG 
GCACAGTTCT TCGCTAATCG TGGTTATGCG GTATTTCGGA TGAACTTCAG GGGCTCGGCA 
GGTTACGGCT ATGAGTTTAT GAAAGCTGGC CTGAAAAGCT GGGGACTCGA AATGCAAAAC 
GACGTCGAAG ACGGGACTCG CTACCTAATA GATCAAGGGA TTAGCGATCC TAAACGTATT 
TGTATTGTCG GAGCTAGCTA TGGTGGTTAC GCGGCCTTAA TGGGTGCAGC CATGACTCCC 
GATCTCTACC GCTGCGCCGT GAGTGTAGCG GGTGTCACAG ATGTGGCCTA TCTAGTGAAA 
TCGAGCCGAA GATTTACTAA CTACAGAGTG GTTAAAGAGC AAATAGGGGA TGACTTTGAT 
GCGCTCTATG ACCGCTCGCC GATCAGTAAA GCCGATAAAA TTAACATCCC AGTATTACTG 
CTACATGGCG ATAAGGACAG AGTGGTTAAG GTTCAACATA GCCGAGAAAT GTATGACGAA 
CTCAAATCAC TGAAAAAACC AGTGGAGTAT ATTGAGCTGG AAAATGGCGA TCATTACCTG 
AGCAATAACG ACAACAGACT CGCGACGTTT AAAGCCTTAG ATAAGTTCTT AGCTGATAAT 
CTCAACCCTA AGTTATAA

Protein sequence

MKRILPLLFM WLCNHAVADT APQLPVEAFA SIPDVSSVQL SPNGKKLASV VRVDQAKLKG 
TVVSIQDIET GEKSIPLHTD NQKFVILSLQ WANDNILLIS AKFPANRYGT PTTETRLVKY 
DLTTKKTSSV IPRSVLDRLN WIPQHQGQII DLMADDPDNI LLSLDGMGEN VGEDSVLKVN 
LAQGKSSYTQ SAKKKIISWI TDRQHKVRIS IYNDDTEYRI YEQAEQKRDS RLLWTFKAFS 
EDSVWPLGFD ADPNILYVRA YHQGFEAIFK VNLTDPKLTK ELVYANEDTD VEGNLLYSKL 
KKKVIGISEG DGEEYTFWEK EYVGLQNGLK AVLPNAHNYI TQFSADERRY IVYSTSSTEP 
GTYYFGDRDE KTLYPIANRY GRLKSELLAD TQYLTYEARD KLKIDAYLTV PKGLEAKQLP 
TIIFPHGGPI SYDSNDFDYW AQFFANRGYA VFRMNFRGSA GYGYEFMKAG LKSWGLEMQN 
DVEDGTRYLI DQGISDPKRI CIVGASYGGY AALMGAAMTP DLYRCAVSVA GVTDVAYLVK 
SSRRFTNYRV VKEQIGDDFD ALYDRSPISK ADKINIPVLL LHGDKDRVVK VQHSREMYDE 
LKSLKKPVEY IELENGDHYL SNNDNRLATF KALDKFLADN LNPKL