Gene Sama_1078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_1078
Symbol
ID	4603330
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	1305235
End bp	1307031
Gene Length	1797 bp
Protein Length	598 aa
Translation table	11
GC content	55%
IMG OID	639780425
Product	M1 family peptidase
Protein accession	YP_926955
Protein GI	119774215
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0308] Aminopeptidase N
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000177882
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.812437
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTTTG TTATGCACCA GTGGGACAAC CGGCACGACT ATCACTCTTT CGCCAATACC 
GACAGCATCA GGGTGACTCA CCTGTCACTT GATCTCGCCA TCGATTTTGA TACCAGATGC 
CTTCAGGGCT GTGTTCGCCT GGATTTTGTA AGAAAGGAGG GGGATGCGGC CGATGTGTTG 
GTGCTGGATA CCCGGGCACT GGCCATTAAG TCCATTACCG ATGTGCATGG TCAGCCACTG 
GACTGGGGAC TGGGACAGGC CAGTGAGATT CTTGGGCAGG CTCTGGAAAT TATGCTGCCC 
AATGGCATCA CCAGTGTGCT GGTGCATTAT CACACCACAG AGGATGCCGA GGGCCTGCAG 
TGGCTCGATG GCCCTCAAAC TCAAAGTGGC AAACCCTATT TGTTCTCCCA ATCGCAACCC 
GTGAACGCCC GCAGTTGGAT CCCGCTGCAG GATACCCCCA AGGCCCGGGT GACCTTTGAT 
GCCAGAGTCC GTGCCAACCA GCCCTGCAGG GTGGTGATGA GTGCGCTCAA TCAGGCGGAT 
ATGCCCGCAG ACGGTGTATT TGAGTTTGTG ATGGATAAAC CCATGCCGAC CCATTTGCTT 
GCCATTGCCG CCGGCCAGAT TGACCGGGTG CCTGTGAGTG AGCGCAGTGC CGTATTTGCC 
GAGCCTGCCA TGGCTTCGCT GGCCGCCCGG GAGTTTGAAG ATATTGAAGC CATGATGCAG 
ATGGCCGAGT CGATTCTTGG GCCCTATGCC TGGGAGCGAT ACGACATGTT GATTCTGCCG 
CCCAGCTTCC CATTTGGGGG CATGGAAAAC CCTTGTCTGG CCTTTTTGAC CCCCACTCTT 
ATCGCGGGCG ACAAGAGTCT GGTGTCCACC GTGGCCCATG AACTGGCCCA TTCCTGGACA 
GGTAATCTGG TGAGCAATGC CACCTGGCGC GATCTCTGGC TCAATGAAGG CTTTACCACC 
TACTTTACCA ATAGAATTGT GGAAGCCGTT TACGGTCGGG AGCAGGCTCA GCTTGAACTC 
ATGCTGGAGT ACGGCAGGCT GAAGGAAGAA ATGGCGGGTA TGCCGCTGCC ACGGCAAACC 
CTGCCAGCCA ATTTGCAGCA GGACGATCCC AACGCCGCAT TCAATCGCTT TACCTACGAT 
AAAGCGTCCA TGTTTGTGCA CTTTCTCGAG GCGCGCCTGG GCAGACCCGA CTTTGATGCT 
TTTTTGCGGT CCTATATCGA GCACTATGCC TTTGTGGCCA TCACCACCGA AGACTTTGTC 
GAATATGCCA AAGGGACTTT GCTGCAAACC CACCCAGATA AGGTGACTGA GGCAGAGCTC 
AGGGAATGGA TCTATGGCGA AGGCTTGCCA GCGACCTTTA TGCCGCCTAT GTCAGAGAGT 
TTGGGGTGGG TGATAGAGTC CATGACAGAG TGGCTGGAAG GGCATCCTCT GACACCGGAG 
CGCCTGTTTG GCTGGCGGGT TCAGCATTGG CAGTTCTTTT TAAATAACCT GCCGGAGCAG 
ATTTCCCAGG AGCAACTGCT GGAGCTGGAT GAACGCTTTG CCCTCGGGTC ATCCGGCAAC 
GCCGAAATTG CCTGCGATTG GTTCAGGGTA GCTATCCGTA ACCATTACGA CCCGGTACTG 
GAGCAGGTCG AAGCATTTCT GTGCCGTATT GGTCGGGCCA AGTTTGTCCG CCCACTGTTT 
TTGGAACTAC AGATAGCCGG TTATCGACAG GAGCTTGAAG CCATCTATCA CAGGGCCCGT 
GAGAGCTATC ACCCCTCACT GAGGGTGCAA CTCGACCGGA TACTGTTTAA CGAGTAA

Protein sequence

MDFVMHQWDN RHDYHSFANT DSIRVTHLSL DLAIDFDTRC LQGCVRLDFV RKEGDAADVL 
VLDTRALAIK SITDVHGQPL DWGLGQASEI LGQALEIMLP NGITSVLVHY HTTEDAEGLQ 
WLDGPQTQSG KPYLFSQSQP VNARSWIPLQ DTPKARVTFD ARVRANQPCR VVMSALNQAD 
MPADGVFEFV MDKPMPTHLL AIAAGQIDRV PVSERSAVFA EPAMASLAAR EFEDIEAMMQ 
MAESILGPYA WERYDMLILP PSFPFGGMEN PCLAFLTPTL IAGDKSLVST VAHELAHSWT 
GNLVSNATWR DLWLNEGFTT YFTNRIVEAV YGREQAQLEL MLEYGRLKEE MAGMPLPRQT 
LPANLQQDDP NAAFNRFTYD KASMFVHFLE ARLGRPDFDA FLRSYIEHYA FVAITTEDFV 
EYAKGTLLQT HPDKVTEAEL REWIYGEGLP ATFMPPMSES LGWVIESMTE WLEGHPLTPE 
RLFGWRVQHW QFFLNNLPEQ ISQEQLLELD ERFALGSSGN AEIACDWFRV AIRNHYDPVL 
EQVEAFLCRI GRAKFVRPLF LELQIAGYRQ ELEAIYHRAR ESYHPSLRVQ LDRILFNE