Gene Sama_1101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_1101
Symbol
ID	4603353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	1324974
End bp	1326563
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	57%
IMG OID	639780448
Product	aminopeptidase
Protein accession	YP_926978
Protein GI	119774238
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.252939
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACCCGA CCTCCCGCCT GTTTTTGGGC CTCGGACTGT GCCTGTCTGC CCAGGCCTTT 
GCCGCCCCGC TGACCTTTGA TGAAACCGCA TTCCGCGAAG ACGTGAAGAC CCTTGCCAGT 
GACGCCTTTG GCGGCCGCGC GCCCCTCTCC GATGGTGAGC AAAAGACCCT CGATTACCTC 
ACCCATGCCT TTAAGTCGAT GGGCCTGAAA GGCGCTTTCA ATGGCGAATA TTTGCAGGCA 
GTGCCGATGG CGAAAATCAC CGCCGATCAG AGCATGGTGC TTAAGGTGGG TGAACTCAGC 
TTTACCTCGG GTGAGGATTT CACTGCACGT ACCCAGAGGG TGGTACCCAA GGTAGAACTG 
AGTGGCAGCG ACATGGTGTT TGTCGGTTAC GGCATCAATG CCCCCGAATA CGGCTGGAAT 
GACTACGCAG GTATCGATGT GCGCGGCAAA ACCGTGGTGC TGCTGGTTAA CGACCCGGGC 
TTTGCCACCC AGGACCCCAA GGTCTTCAAA GGCAACGCCA TGACCTACTA CGGCCGCTGG 
ACCTACAAGT ATGAAGAAGC CGCCCGTCAG GGGGCAGAAG CCGTGTTTAT CGTCCATGAA 
GATGCTCCGG CGGCGTACGG CTGGGGCGTG GTGAAAAACT CCAATACCAA TACCAAGTTC 
ACTTTGGTTG ATGGCAATAA CAACCAAAGT CAGGTGGGCG TGATGGGCTG GCTGCAATAT 
GCGGCGGCCA AGCAGATTCT GGCGGCTTCC GGCCAGGATA TTGAAGCGCT GAAAGCCGCA 
GCCAAGGCGC CGGGCTTTAA AGCCGTGCCC TTGACGGTGC AAGCCGATTT GACCCTCAGT 
AATCATATCG AGCGCGCCGA GTCCCATAAC GTGGCCGCCA TATTGCCCGG CAACAAAAAT 
GCCGATGAAG CTGTGGTGAT GCACGCCCAT TGGGATCACC TTGGCCAAAT CGAGGAAGAG 
GGCAAAACCA TCATCCTCAA TGGTGCCGTG GATAACGCCA CCGGCGTGGC CGGGGTACTG 
GCGCTGGCAA GACACTATGC TGCCTTGCCA GAGGCAGAAA AGCCCGCCCG CAGCATGATT 
TTTTCCGCTT TCACTGCTGA GGAAACCGGC CTGATTGGCG CCCAGTATTT TGCTGAAAAT 
CCGCCGTTGC CGACATCTAA GCTGGTGGCT TTTTTAAACA TTGATGGCAT GAATGTGGGC 
GAAGGCGTGG ATTACATATT GCGCTACGGT GAAGGGGTCT CTGAGCTGGA AACTATGCTC 
AGTGACGCCG CCAAGGCCCA GAACAGACAG GTGAAGGCCG ACCCACGACC TCAAAATGGC 
CTGATGTTCC GCTCGGATCA TTTTGCTCTG GCGCAGCAAG GGGTGCCCGG ACTGCTGTTT 
ATGAGCCTGG GTGACACCGA CCCTGACTAC ATTGCCCACA AGTACCACAA GGGCGCCGAC 
GATTACTCCC CGGACTGGCA ACTTGGTGGT GTAAAGCAGG ACCTTAAATT GATTGAGCAA 
ATTCTTTCGC GCCTTGCCAA TGGCAGCGAA TGGCCCAAGT GGCTGGAAGA GTCTGACTTC 
AAAGCCCGCC GTGCCAAAGA TGGCCGTTAA

Protein sequence

MNPTSRLFLG LGLCLSAQAF AAPLTFDETA FREDVKTLAS DAFGGRAPLS DGEQKTLDYL 
THAFKSMGLK GAFNGEYLQA VPMAKITADQ SMVLKVGELS FTSGEDFTAR TQRVVPKVEL 
SGSDMVFVGY GINAPEYGWN DYAGIDVRGK TVVLLVNDPG FATQDPKVFK GNAMTYYGRW 
TYKYEEAARQ GAEAVFIVHE DAPAAYGWGV VKNSNTNTKF TLVDGNNNQS QVGVMGWLQY 
AAAKQILAAS GQDIEALKAA AKAPGFKAVP LTVQADLTLS NHIERAESHN VAAILPGNKN 
ADEAVVMHAH WDHLGQIEEE GKTIILNGAV DNATGVAGVL ALARHYAALP EAEKPARSMI 
FSAFTAEETG LIGAQYFAEN PPLPTSKLVA FLNIDGMNVG EGVDYILRYG EGVSELETML 
SDAAKAQNRQ VKADPRPQNG LMFRSDHFAL AQQGVPGLLF MSLGDTDPDY IAHKYHKGAD 
DYSPDWQLGG VKQDLKLIEQ ILSRLANGSE WPKWLEESDF KARRAKDGR