Gene Strop_2684 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_2684
Symbol
ID	5059147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	3018052
End bp	3020028
Gene Length	1977 bp
Protein Length	658 aa
Translation table	11
GC content	65%
IMG OID	640474940
Product	glycoside hydrolase family protein
Protein accession	YP_001159506
Protein GI	145595209
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2730] Endoglucanase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.954713
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0577257
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCTGTGA AACCACGATT GCATGCTGCC GCGGTGGCGG CCTGCGTAGC TCTGGGGCTG 
ACAGCCGCCG CCCCGGCCGC GTTCGCCACC ACGTCACCCG AGCCGGAGGC GCAGGTCGTC 
TCGGCCGTAC CGGCGGCGGA CTGGCTACAC ACCGATGGCA ACAAGATTGT GGATGAGGCT 
GGTAACCAGG TGTGGTTGAC CGGCGCGAAC TGGTTCGGCT ACAACGCCAC CGAGCGAGTC 
TTCCACGGAC TCTGGGCGGG CAACATCGAG ACCATCACCC GGCAGATGGC CGAGCGTGGA 
ATCAACATCG TTCGGGTGCC GATCTCCACT GAGTTGCTGC TGGAGTGGAA GGCCGGCCAG 
ACGGTGCTGC CGAACGTGAA CCTGTCGGTC AACCCGGAGT TGGCTGGCAT GGACAACCTG 
CAGATCTTCG ACTACTGGTT GGCCCTCTGC GAGGAGTACG GCCTGAAGGT CATGCTCGAT 
GTGCACAGTG CCGAGGCTGA CAACTCTGGC CATTTCTATC CGATGTGGCA CAAGGGGGCA 
ATCACGCCGG AGCTGTTCTA CCAGGGCTGG GAGTGGGTAG CCGCTCGGTA CCAGAACAAC 
GACACGATTG TCGCGATGGA TATCCAGAAC GAGCCGCACG GCACTCCGAA CAACCCGCCC 
CGGGCCAAGT GGGACGGCAC CAGCGACATC GACAACTTCA AACACGCCTG TGAGACGGCC 
GGCAACCGAA TTCTGGCGAT CAACCCGAAC GTGCTGATTC TCTGCGAGGG CGTCGAGGTC 
TACCCGCGGC CGGGGGAGAG CTGGGACTCA CCCAACACCG ACCCGGACCA GAGCCCCAAC 
TACCACTACA ACTGGTGGGG CGGCAACCTG CGTGGGGTGA AGGACCACCC GATCAACCTG 
GGAGCCCACC AGGACCAGCT GGTCTATTCG CCGCACGACT ACGGGCCGCT GGTGCATGAG 
CAGCCGTGGT TCCAGAAGGA CTTTGACAAG ACCACGTTGA CCAACGACGT GTGGCGGCCA 
AACTGGCTCT ACCTCCACGA GGAAGACACC GCGCCGCTGC TGGTCGGCGA GTGGGGTGGC 
CGGTTCGGGC AGGACGATCG GCAGGACAGG TGGCTGAAGG CCCTGCGGGA CCTGATGGCG 
GAGATGGTGA TTCACCATAC CTTCTGGTGT CTCAACCCGA ACTCCGGCGA CACCGGCGGC 
CTGCTGCAAC ACGATTGGCA GACCTGGGAC GAGGTCAAGT ACGACCAGGT GCTCAAGCCG 
GCGCTCTGGC AGCACAACGG CAAGTTCGTC AGCCTTGACC ACCAGGTACG CCTCGGTGGC 
GAAGCCTCGA CCACCGGCAT CAGCCTCACC GAGCGCTATG CCGGCGGCGG GAACGACACC 
GTCGTGCCGA CCGCCCCGGG TCGTCCCGTG GCCAGTGACC TGACTTCCTC GGCAGTCACC 
CTGACCTGGG AAGCGTCCAC TGACAACGTC GGAGTTGTCG CGTACGAGGT GCGGAACGCG 
ACAGACGGTG GCCCGCCGAA CACGGTCGCC ACCGTCGCCG GTACCACCTA CCAGGTGACC 
AACCTCGCGG CCGAGACCGA ATACACCTTC ACGGTACGGG CCCGGGACGC GGCCGGAAAC 
TTCTCCGCCG CCTCCCCGGC CCGTACCGTC ACCACCCCAC CCGGTGGTGG TGGAGGCAGC 
GGCTGTAGCG CCACGTACCT GCTGATGAAC ACGTGGTCGG GGGGCTTCCA GGGTGAGATC 
ACCGTGGAAA ACACCGGTCC CGCAGCCATC GCCGGCTGGC GGGTCAGCTG GAACGACCCG 
GGCGGGACTG CGATCACCTC GCTGTGGAAT GGCAGGTGGA CGGTCACCGA TGGCGCGAAT 
GTGGTGATCA ACGAGTCGTA CAACGGTCAG CTGGCGGCCG GGAGTAGCAC CACGTTCGGC 
TTCACCGGGA CCGGTCCGGG CACCGCGCCG GGCGGGCTGA CCTGCTCCGC CCCGTGA

Protein sequence

MSVKPRLHAA AVAACVALGL TAAAPAAFAT TSPEPEAQVV SAVPAADWLH TDGNKIVDEA 
GNQVWLTGAN WFGYNATERV FHGLWAGNIE TITRQMAERG INIVRVPIST ELLLEWKAGQ 
TVLPNVNLSV NPELAGMDNL QIFDYWLALC EEYGLKVMLD VHSAEADNSG HFYPMWHKGA 
ITPELFYQGW EWVAARYQNN DTIVAMDIQN EPHGTPNNPP RAKWDGTSDI DNFKHACETA 
GNRILAINPN VLILCEGVEV YPRPGESWDS PNTDPDQSPN YHYNWWGGNL RGVKDHPINL 
GAHQDQLVYS PHDYGPLVHE QPWFQKDFDK TTLTNDVWRP NWLYLHEEDT APLLVGEWGG 
RFGQDDRQDR WLKALRDLMA EMVIHHTFWC LNPNSGDTGG LLQHDWQTWD EVKYDQVLKP 
ALWQHNGKFV SLDHQVRLGG EASTTGISLT ERYAGGGNDT VVPTAPGRPV ASDLTSSAVT 
LTWEASTDNV GVVAYEVRNA TDGGPPNTVA TVAGTTYQVT NLAAETEYTF TVRARDAAGN 
FSAASPARTV TTPPGGGGGS GCSATYLLMN TWSGGFQGEI TVENTGPAAI AGWRVSWNDP 
GGTAITSLWN GRWTVTDGAN VVINESYNGQ LAAGSSTTFG FTGTGPGTAP GGLTCSAP