Gene Sama_2117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_2117
Symbol
ID	4604367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	2560706
End bp	2561896
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	56%
IMG OID	639781502
Product	hypothetical protein
Protein accession	YP_927992
Protein GI	119775252
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAATC CAGGATTGCG TTCTGCACTG CTGATGCTGC AACCCAAACT GCCGTTACTT 
TTACTTGTGG CGCTCACGGC CTGTGGTGGT GAAGGTGAGA GCACAGCGCC CACAGCGCCG 
CCCTCAATTG TCGTAACGCC GCCTGCCACT TCGGTGTGCG ACAACAATAA TGGCAGCATC 
AATCATGAGG CCCTGATGAG CACAAACTGT GCGCGCTTGT CTGACTACCG GCTTTTCAGC 
GACAGCCGCA ACCCGGCTCT GGCACCCCAT ACGCCGGGTG TGGCCTACCA GCTCGCCAGT 
GAGCTTTTTA CCGACTATGC CATTAAACGC CGCTTTATCT TCTTACCCGA AAACAAGCCC 
ATGGTGTTAC AAGGAGATGC CCTGTCGTTG CCGGTGGGCA CCGTGTTGGT TAAAAGCTTC 
TTACTGCCTT CAGATACCTC AGACACCAAT GTTTCTGCTG CCCGGCTTAT CGAGACCCGG 
CTGCTTATCC ACCGCGAGAG TGGATGGACG GCGCTGCCCT ATCTGTGGAA TGGGGATGAG 
GCGTACCTTG CCGAAACCGG TGCCGATGTA TCCCACAGTA TGAATAGCAC AAATGACACG 
CTGAACTTCA CCTATCACGT GCCCAGCCGC GCCGAGTGTA AGATTTGCCA TCAAAGCGCC 
CGGAATGGCC TGACCACCAT AGCGCCCATA GGTCCCAAAC CGCTGCTGCT GAACAAAGCC 
ATCACCGTTA ATGATGAGTC GATTAATCAG CTGACATGGT TTGCATCCCA GGGGCTGCTC 
ACAGGGCTTG GCGAGATTGA CTCACTGCCA CAGACCTTTG CCATTGGGGA TGAGCAGCAA 
AACCTTACCG CGCGGGTGAA AGGCTATCTC GATGTGAACT GTGCCCATTG CCACAAGGCC 
GACGGCTTTG CCAGCGTATC GGGACTCAGG CTCGGGTTCG AAACCGATCA TCACAGCTAT 
CAGTACGGAA TTTGTAAGCA GCCGCCCGGT TGGGATGGCG GCGAGCGGGG GCTTTCCTAC 
GACATAGTGC CGGGCAACGG CGACCACTCG ATTCTGGTCT ATCGACAGAC GCTTTCAGCG 
GCCAAAGACC GCATGCCGCC AGTGGGACGA GCTTTGGTGC ACAGTGAAGC CGTAACGCAG 
ATCAGTCGCT GGATAGACTT GATGGCCCCG TCGGTGGGTA ACTGTCAGTA G

Protein sequence

MSNPGLRSAL LMLQPKLPLL LLVALTACGG EGESTAPTAP PSIVVTPPAT SVCDNNNGSI 
NHEALMSTNC ARLSDYRLFS DSRNPALAPH TPGVAYQLAS ELFTDYAIKR RFIFLPENKP 
MVLQGDALSL PVGTVLVKSF LLPSDTSDTN VSAARLIETR LLIHRESGWT ALPYLWNGDE 
AYLAETGADV SHSMNSTNDT LNFTYHVPSR AECKICHQSA RNGLTTIAPI GPKPLLLNKA 
ITVNDESINQ LTWFASQGLL TGLGEIDSLP QTFAIGDEQQ NLTARVKGYL DVNCAHCHKA 
DGFASVSGLR LGFETDHHSY QYGICKQPPG WDGGERGLSY DIVPGNGDHS ILVYRQTLSA 
AKDRMPPVGR ALVHSEAVTQ ISRWIDLMAP SVGNCQ