Gene Sama_0078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_0078
Symbol
ID	4602335
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	84659
End bp	86656
Gene Length	1998 bp
Protein Length	665 aa
Translation table	11
GC content	50%
IMG OID	639779390
Product	prolyl oligopeptidase family protein
Protein accession	YP_925960
Protein GI	119773220
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTGA TGATGACCAT AGTGCTATCG CTTATATGGA TGTGGGTGAG CCCCACCGCC 
CACGCCTATA CGCAATTAAC AAAAGACGAC TTTATCAGTG ACCCTCTCAT CTACGACGCC 
GAATTTTCAC CGGATGGTCG TTATCTGGCG TTTATTCGCC AGGCAGGTAA GAGCCGCGAT 
GTTGTCATCC GGGACTTTTC TCAGGAAGGG GCGCCTATCA CCGGGATATT GCAGGATGAA 
TTTATTCGCG CCGACTCTAT TAGTTGGGCA AATAACACTC GGGTGATTGT GAATCTGATG 
GTGCCCTACG AGCGTATCTC CAAATTAAAA AAGAAGGCGG AGAAAGACCC GGAGTTCGAC 
CTCGATGAGT ACGATTACTT CAGGCGTTCC ATTTCCATGG ATGTGCACTG TCAGGATAGG 
GTGGTGCTGC TCAACCATAA AAAATACAGC CGCAAAAACT TAAACCTGTC CAGAGTCAGT 
AACCTGCTGG TGGATGACGA GCAGCATATT CTTATGCCCG CCTGGGGCCA TAAAGGCCTC 
GAAATCATGA AAGTGAATGT GTACACGGGG AAGGGTGAAG TGGTGCTGGA GGGCGGAAGG 
CGCACCTACA ACATTTTAAC CGACAAACAG GGCCAGCCTA CGTTCAGGCT GGACTATTAC 
TATTACAGCC GCAGTGTGCA AGTGTACGAA TACACTCAGG AAGGCGAATG GGTTCCCATC 
GACCGTATCT ATTTCGAGCA AAATGAAGAT GGCGAATTCG ACTTTGAAGG CTTGGTAGGT 
ATTGGTAAGG AAGGCGAGCT GATATACCGC AAGCGCAATG AAACGAGCGG CTATTATGAA 
ATCGTCAAAT ATAAAAAAGG CAGCAAAGAG AAGCAGGTTG TCGCCTCGCT GCCTGAAGAA 
GATATTTACT CTCCCATGTT TGACGCCTTC ACCGGCGAAT ATCTGGGTTA CCAGGTGCAG 
CGGGACCTCA TCCGTAATGT GTATTTGGAT AAGAGTTATC AGGCCCACTA CGACAAGGTG 
GCTGAAGACA TAGGGCACAG CAACTTCTCT TTCTGGGCTT CGAGCACCAG TAAAAACCGT 
GTGGTGGTAA AAAGCAGCGG TGCAGACCAT CTGGGCAAAT TCTATGTTTA CGACTACAAG 
ACCCAGGCCC TGACATGGCT GGGGGATGTA CATAATCAAC TGGTGCCCGA GAATCTCGGG 
TTGCCCGCCA AGGTGAATTA CAGTACCAGA GACGGGCAAA AGCTGCGTAT GTACCTGCTA 
TTCCCACCCA ATTATGACGA CACCAAAGCC TACCCTATGG TGGTGTTACC CCACGGCGGC 
CCACAATCCC GTGACAGTGC CAGCTTTGAT TTCTTCGCCC AGTTCATTGC TACCCGGGGT 
TATATCGTCA TACAGCCAAA CTTCCGCGGT TCTACCGGTT ATGGACTGGA ATTTGAGAAA 
GCTGGCTACA AACAGTGGGG ACAGCGGATG CAGGACGATG TGTCAGACGC CGTCACCTAC 
ATGACCCAAA ATGGCTACGC GGATAAGTCC AGGGTGTGCA TTGTGGGGGC CTCCTATGGT 
GGTTATGCCG CGCTGATGGG CGCCATTAAA ACCCCTGAGC TGTACCGTTG CAGCATCAGT 
ATTAACGGGG TGACCCACCT TAAAGATCAA ATCGCGTTTG ACGTGGATTC CGCAGAAATA 
AACGAAGACA GAATTGAAGA GATACTCTAC GAACGCATTG GTCATCCCAT CCGGGACGCC 
AAAATGTTGG ATGACAATTC ACCGGCGTTA CTTGCATCAA AAGTGAGCTT ACCACTGCTG 
ATTATCGCCG GAGACAGCGA TCAAATCGTG CCCTACACCC AGGCTGAAGT CATGGTTGAG 
GCACTGGCGA AGTCGAAGAA AGACTTTAAG TTTGTCGAAC TGACAGACAC AGGCCATAAC 
CCCTTTATCC TGAAAGACAG CGCCGCCAAG GTGTATCAGG AAGTTGAGCA GTTCCTGAAA 
ACTCACCTTG GGGAATAG

Protein sequence

MKVMMTIVLS LIWMWVSPTA HAYTQLTKDD FISDPLIYDA EFSPDGRYLA FIRQAGKSRD 
VVIRDFSQEG APITGILQDE FIRADSISWA NNTRVIVNLM VPYERISKLK KKAEKDPEFD 
LDEYDYFRRS ISMDVHCQDR VVLLNHKKYS RKNLNLSRVS NLLVDDEQHI LMPAWGHKGL 
EIMKVNVYTG KGEVVLEGGR RTYNILTDKQ GQPTFRLDYY YYSRSVQVYE YTQEGEWVPI 
DRIYFEQNED GEFDFEGLVG IGKEGELIYR KRNETSGYYE IVKYKKGSKE KQVVASLPEE 
DIYSPMFDAF TGEYLGYQVQ RDLIRNVYLD KSYQAHYDKV AEDIGHSNFS FWASSTSKNR 
VVVKSSGADH LGKFYVYDYK TQALTWLGDV HNQLVPENLG LPAKVNYSTR DGQKLRMYLL 
FPPNYDDTKA YPMVVLPHGG PQSRDSASFD FFAQFIATRG YIVIQPNFRG STGYGLEFEK 
AGYKQWGQRM QDDVSDAVTY MTQNGYADKS RVCIVGASYG GYAALMGAIK TPELYRCSIS 
INGVTHLKDQ IAFDVDSAEI NEDRIEEILY ERIGHPIRDA KMLDDNSPAL LASKVSLPLL 
IIAGDSDQIV PYTQAEVMVE ALAKSKKDFK FVELTDTGHN PFILKDSAAK VYQEVEQFLK 
THLGE