Gene Strop_2001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_2001
Symbol
ID	5058464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	2271513
End bp	2273282
Gene Length	1770 bp
Protein Length	589 aa
Translation table	11
GC content	67%
IMG OID	640474267
Product	Alpha-amylase
Protein accession	YP_001158833
Protein GI	145594536
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.357099
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.053891
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGACCA CGCTCGGTCC ACACCGCTGG CGTCGGCGTG CAGCCGGCCT CCTCGCCGCC 
GCTCTCGTCA CCGCCATCAC CGCCATCACC GCCACCTCGC TGCCGGCCAA CGTTCAGGCG 
TCGCCGCCGG GCGACCGGGA CGTCACCGCC GTCCTGTTCG AGTGGCGCTT CGACTCGATT 
GCCCGCGCCT GCCAGGACAC ACTGGGGCCC AAGGGATACG GCTTCGTGCA GGTCTCCCCA 
CCGCAGGAGC ACATCCAGGG CTGGCAGTGG TGGACGTCGT ACCAACCCGT CAGCTACGAC 
ATCTCCAGCC GGCTGGGTGA CCGGAACGCG TTCCGGGCCA TGACCGAGGC CTGCCACGGC 
GCCGGAGTGA AGGTCATCGT GGACGCGGTC ATCAACCACA TGACCGCAGG ATCCGGCACC 
GGCACCGGCG GCACTAACTA CAACAAGTAC GACTACCCAG GCTTCTACCA GGTCCAGGAC 
TTCCACTCCT GCCGCAAACA CATCAGCGAC TACCGCAACC GCTACGACGT CCAGGAGTGT 
GAACTGCTCG GCCTGGCCGA CCTGAACACC GGGTCCGACT ACGTACGGGG GCGTATCGCT 
GGCTACCTCA ACGACCTTCT CTCCCTCGGC GCGGACGGCT TCCGCATCGA CGCGGCCAAG 
CACATCGCCG CCAGCGACCT GGCGGCGATC CGCTCCCGGA TGAGCAACCC CAACGCCTAC 
TGGATCCAGG AAGTGATCTA CGGTGCCGGT GAGGCGGTCC AGCCCAGCGA GTACCTTGGC 
ACGGGCGACG TGCAGGAGTT CCGCTACGCG CGGGACCTGA AGCGGGTGTT CCAGAACGAG 
AAGCTGGCCT ATCTGCGCAA CTACGGCGAA GGTTGGGGCT ACCTGTCCAG CGGCAAGGCC 
GGCGTCTTCG TCAACAACCA CGACACCGAA CGCAACGGCG AGACCCTCTC CTACAAGAAC 
GGCTCCGACT ACACGCTCGC CAACGTGTTC ATGCTCGCCT GGCCGTACGG CACGCCGCAC 
GTGCACTCCG GCTACGAGTT CAGCGACCGG GACGCCGGCC CACCCAACGG CGGCCACGTC 
AACGCCTGCT ACTCCGACGG GTGGACGTGT CAACACGCCT GGCGCCAAAT AGCCAACATG 
GTGGGCTTCC GCAACGCCGC CGCCGGGACC GGTGTGACGA ACTGGTGGGA CAACGGCAAC 
GACCAGATCG CGTTCGGCCG CGGTGACCGT GCCTTCGTCG CCATCAACCA GGAAGGCGGC 
ACCCTCACCC GAACCTTCCA GACGTCACTG CCCGCCGGCA CCTACTGCGA CGTGCAGCAC 
GGCGACCCGA CCACGAGCGG TGGATGCACC GGCCCCACCT ACACGGTCAA CTCCTCGGGC 
CAGTTCGCCG CGAGCATCGG CCCGGGTGAC GCGGTCGCCC TCTACCGCGG CGCCGCGGGC 
AGCCCGACTC CGGACCCGTC CCAGTCCCCG TCGGATCGCG TCAACGTCAC GTTCGCGGTC 
ACCGCCACCA CCGTCTGGGG GCAGAACATC TTCGTCGTCG GTGACCACCC TGACCTCGGC 
TCATGGAACC CCGACCGCGC CCTGCCGATG AGCGCCGCCA GCTACCCCCA GTGGCGGCTG 
ACCACTCCCC TGCCCAGCGG CAGCGCCATC CAGTACAAGT ACATCCGCAA GGAGTCCAAC 
GGTCACGTTA CCTGGGAAAG CGGCAACAAC CGGACCGCCA CGATCCCGAA CAGCGGAACA 
CTGACCCTGA CCGACAATTG GCGAAACTGA

Protein sequence

MLTTLGPHRW RRRAAGLLAA ALVTAITAIT ATSLPANVQA SPPGDRDVTA VLFEWRFDSI 
ARACQDTLGP KGYGFVQVSP PQEHIQGWQW WTSYQPVSYD ISSRLGDRNA FRAMTEACHG 
AGVKVIVDAV INHMTAGSGT GTGGTNYNKY DYPGFYQVQD FHSCRKHISD YRNRYDVQEC 
ELLGLADLNT GSDYVRGRIA GYLNDLLSLG ADGFRIDAAK HIAASDLAAI RSRMSNPNAY 
WIQEVIYGAG EAVQPSEYLG TGDVQEFRYA RDLKRVFQNE KLAYLRNYGE GWGYLSSGKA 
GVFVNNHDTE RNGETLSYKN GSDYTLANVF MLAWPYGTPH VHSGYEFSDR DAGPPNGGHV 
NACYSDGWTC QHAWRQIANM VGFRNAAAGT GVTNWWDNGN DQIAFGRGDR AFVAINQEGG 
TLTRTFQTSL PAGTYCDVQH GDPTTSGGCT GPTYTVNSSG QFAASIGPGD AVALYRGAAG 
SPTPDPSQSP SDRVNVTFAV TATTVWGQNI FVVGDHPDLG SWNPDRALPM SAASYPQWRL 
TTPLPSGSAI QYKYIRKESN GHVTWESGNN RTATIPNSGT LTLTDNWRN