Gene Shewmr4_2136 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_2136
Symbol
ID	4252709
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	+
Start bp	2555134
End bp	2557248
Gene Length	2115 bp
Protein Length	704 aa
Translation table	11
GC content	48%
IMG OID	638118760
Product	alpha amylase, catalytic region
Protein accession	YP_734266
Protein GI	113970473
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAATTTTC TATTATCTAA CAGCAGCAAA CGTCGCGCTT ATCGCTGGCA ACAGGGATTT 
AGCATACTGG CCCTCAGCAG CATTAGCACC TTTTGCACCA TGGCCGCACC AGCAATCAGC 
ACTCAAGCAA CGGCGGCTAA AACCATGGCT GCCAATCCAA ATGTGGCCGA AGGCGAAATC 
CTGCCAGCCC GTCACAATGA CGAGCAAGCA AATAAGTTTA AACCCGTTGT TTATCAAATT 
TTTACCCGAC TCTATGGCAA TAAAAACACC ACCAATAAAC CTTGGGGCAC GATTAGCGAA 
AACGGTGTGG GTAAATTTAA TGATATTGAT GACATAGCAC TCAAAAGTAT CAAAGACTTA 
GGCGTTACCC ATGTGTGGTA TACGGGTGTG CCCCACCACG CCTTAATTGG CGATTACAGT 
GCAATTGGCG TAAGTCACGA TGATCCCGAT GTGGTTAAGG GCCGCGCCGG TTCGCCCTAT 
GCGGTTAAAG ATTATTACAA CGTAAACCCC GATTTAGCAG TCTACCCCGC CAAGCGCTTA 
CAGGAGTTTC AGGCTCTTAT CGAGCGCACC CACAAGCAAG GCTTAAAGGT GATTATCGAT 
ATAGTCCCTA ACCATGTGGC GCGTAATTAC CATTCCATCA CTAAGCCCGA GGGCGTGCGT 
GATTTTGGTG AAGATGATAA TCAAACCCTT GAATATGAAA GGCATAATAA CTTTTACTAT 
GTGACTGATA AAAAGCAATC CTCTGGCTTT CAAGTGCCCG ATTTGCCTGA TACCCTCAAA 
CCGTTAGGCG GCGAATCGCA TCCCCTAAGT GATGGTCAAT TTGAAGAGAT CCCCGCCAAA 
TGGACTGGCA ACGGCTCACG CCTTGCCAAA CCGGATATGA ATGACTGGTA TGAAACCGTT 
AAAATCAATT ACGGTGTCCG CCCCGATGGC AGCCATGATT TCCCCGCACT GCCGCCACGC 
TATGCCACAC TCGGCGCCGA GCAGCACTAT GCTTTTTGGC AGCAACATAG CCATGAATTA 
CCTAACTCTT GGATCAAGTT CAATCAAATT GCCCAATATT GGTTAGCGAT GGGAGTCGAT 
GGATTTCGTT ACGATATGGC CGAAATGGTG CCAGTCGAGT TTTGGAGCTA TTTAAATAGT 
CATATAAAAC ATAGCCATCC CGAAGCCTTT ATCTTAGCAG AGGTCTATAA CCCTGCGCTG 
TATCGCGACT ATATTCATCT CGGCAAAATG GACTACCTCT ACGACAAGGT CGATCTTTAC 
GACACCCTCA AAGCCATTAT GGCAGGACAA AAAAGTACCG CGCAGATCGC CGCGGACCAG 
GCCAAAGTGC AAGATATCGA CTCGCATATG CTGCATTTTT TAGAAAACCA CGACGAGCAG 
CGCATCGCCA ATGCCGCCTT TTTAGGCGTA TTAACTGGTA ACACCTCGAC AGATGCGGTC 
GATCCCCGCT ACGCCCTGCC TGCAATGGTG GTGTCGGCGA CCTTAAGTAC CTCACCCACC 
TTGCTTTATT TCGGTCAAGA AGTGGGAGAA GCGGCGACGC AAAACCTAGG CTTTGGCCAT 
GCGTCACGCA CCAGTATTTT TGATTATGCG GGTGTTCCCG CCCATCAGCG CTGGATGAAT 
CAAGGTAAAT TTGATGGTGG CCAATCAACC GCCGCAGAAG TTGCGCTACG TACCTATTAC 
CAAAAATTAT TGAACCTGAG CACGGGGAAA AATGCACCCG CGCTCTTAGG GAAATATCAC 
TCGCTAGATG CTGCCAACCG CAGCGCGGTA TCGGCTGCAA AGGCTAGCAA TAAGGCTAGC 
AATAAGACAA ACAATGGCAG CGCAACGGGT TATGATGACT CAACCTTTGC CTTTGTCCGC 
TTTGAGGCCC ATACAGCCAA TAGCAAAGGT CAAAAGCTGA TTATTGTCAG TAACTTTAGT 
CAAACCCAAG CCAAGTTATT TTCCCTTAAA CTCCCCAAAT CTTTGATTGC GCAATGGCAG 
TTAACCGATG CAAGCTATCC GCTTAAGGAT TTACTGGAAG AACATACGGC GCAGTTAATT 
GTCGAGCGAG GTGAAGGACA GGTTCAGTTG CAGCTTGCAC CTCTCTCCTC CGCGATATTT 
GAACTCGTCC ACTAG

Protein sequence

MNFLLSNSSK RRAYRWQQGF SILALSSIST FCTMAAPAIS TQATAAKTMA ANPNVAEGEI 
LPARHNDEQA NKFKPVVYQI FTRLYGNKNT TNKPWGTISE NGVGKFNDID DIALKSIKDL 
GVTHVWYTGV PHHALIGDYS AIGVSHDDPD VVKGRAGSPY AVKDYYNVNP DLAVYPAKRL 
QEFQALIERT HKQGLKVIID IVPNHVARNY HSITKPEGVR DFGEDDNQTL EYERHNNFYY 
VTDKKQSSGF QVPDLPDTLK PLGGESHPLS DGQFEEIPAK WTGNGSRLAK PDMNDWYETV 
KINYGVRPDG SHDFPALPPR YATLGAEQHY AFWQQHSHEL PNSWIKFNQI AQYWLAMGVD 
GFRYDMAEMV PVEFWSYLNS HIKHSHPEAF ILAEVYNPAL YRDYIHLGKM DYLYDKVDLY 
DTLKAIMAGQ KSTAQIAADQ AKVQDIDSHM LHFLENHDEQ RIANAAFLGV LTGNTSTDAV 
DPRYALPAMV VSATLSTSPT LLYFGQEVGE AATQNLGFGH ASRTSIFDYA GVPAHQRWMN 
QGKFDGGQST AAEVALRTYY QKLLNLSTGK NAPALLGKYH SLDAANRSAV SAAKASNKAS 
NKTNNGSATG YDDSTFAFVR FEAHTANSKG QKLIIVSNFS QTQAKLFSLK LPKSLIAQWQ 
LTDASYPLKD LLEEHTAQLI VERGEGQVQL QLAPLSSAIF ELVH