Gene Strop_2285 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_2285
Symbol
ID	5058748
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	2578492
End bp	2579880
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	66%
IMG OID	640474547
Product	glycoside hydrolase family protein
Protein accession	YP_001159113
Protein GI	145594816
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2730] Endoglucanase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTGG GCATGAGGAC TGTGGCCCTG GCGGGCGTCC TCGCGGTGGT GGCCGCGGGG 
GCCCTGGTGG CCAGCGCCAC CGCGACCGCG GCGGCCGCAC CGGCCGCGAC GTTCGTCAAG 
GTTTCCGACT GGGGTAGTGG CTGGGAAGGC CGATACACCA TCACCAACGG GGGAAGCAGC 
ACCCTGAACT CCTGGCAGGT CGAGTTCGAC CTACCGGCGG GCACGAGCGT CGGCTCGTAC 
TGGAACGCGT TGATGGACCG CGACGGACAG CGCTACCGCT TCACCAACCA GCACTGGAAC 
GGCACGATCG CACCGGGCTC CTCGGTGACG TTCGGCTTCC TCGGCGCCGG CCCGGGCAGC 
CCGAGCGGTT GCCAGCTCGA CGGCCAGCCG TGCGAGCCGA CAGCTCCTCC GACGACCAGC 
CCACCCCCAC CACCACCGAC CACCGCGCCT CCCGGTAGCA CACCGGTTGC GGCGAACGGG 
CAACTGCGGG TCTGTGGTGA GCAGCTGTGT AACGAGAACG GCAAGCCGAT CCAACTGCGC 
GGCATGAGCA CGCACGGTCT TCAGTGGTAC GCCAACTGCG CGACCAGCGC CTCGCTCGAC 
GTCCTCGCCC AGCAGTGGGG CGCCGACGTC CTGCGGATCT CGATGTACAT CCAGGAAGGC 
GGCTACGAGA CCGACCCGCG TGGCTTCACC GATCTTGTCC ATGATTACAT CGAGATGGCC 
ACCGCTCGCG GTCTCTACGC GATCGTTGAC TGGCACATGC TCACGCCGGG AGATCCGAAC 
GACAACCTGT CGCGCGCGCA GACCTTCTTC GCCGAGATCG CCGACCGCCA CCGGGACAAG 
GTGAACGTGC TCTACGAGAT CGCGAACGAG CCGAACGGTG TCAACTGGAG CGCGGTCAAG 
AGCTACGCCG ACCAGGTCAT CCCGGTCATC CGGGAACGGG ACCCGGAGTC CGTGGTGCTC 
GTCGGCACCC CCGACTGGTC GTCGCTCGGT GTCTCCGGAA GTGGCGGCGG CGTTGACGCC 
ATCACCGCCA ACCCGGTGTC GGCAAGCAAC CTCATGTACG TCTTCCACTT CTACGCGGCC 
TCGCACGGCG ACCTGTACTA CAACACCCTG GCGGCGGCGG CTGACCGAAT CCCGATCTTC 
GTGACCGAGT TCGGCACCCA GCAGTACACC GGTGACGGTC CGAACGACTT CACCATGTCC 
CAGCGTTACC TCGACCTGAT GGCGAGCAAG AAGATCAGTT GGGTCAACTG GAACTACTCC 
GACGATTTCC GCTCCGGCGC GGTCTTCACC ACAGGAACGT GCGCCAGCGG CGACTTCGGC 
GGTACGGGCC CGCTCAAGCC GGCCGGTAGC TGGATTCGCG ACCGCATGCG TACCGCTGAC 
GACTTCTGA

Protein sequence

MKLGMRTVAL AGVLAVVAAG ALVASATATA AAAPAATFVK VSDWGSGWEG RYTITNGGSS 
TLNSWQVEFD LPAGTSVGSY WNALMDRDGQ RYRFTNQHWN GTIAPGSSVT FGFLGAGPGS 
PSGCQLDGQP CEPTAPPTTS PPPPPPTTAP PGSTPVAANG QLRVCGEQLC NENGKPIQLR 
GMSTHGLQWY ANCATSASLD VLAQQWGADV LRISMYIQEG GYETDPRGFT DLVHDYIEMA 
TARGLYAIVD WHMLTPGDPN DNLSRAQTFF AEIADRHRDK VNVLYEIANE PNGVNWSAVK 
SYADQVIPVI RERDPESVVL VGTPDWSSLG VSGSGGGVDA ITANPVSASN LMYVFHFYAA 
SHGDLYYNTL AAAADRIPIF VTEFGTQQYT GDGPNDFTMS QRYLDLMASK KISWVNWNYS 
DDFRSGAVFT TGTCASGDFG GTGPLKPAGS WIRDRMRTAD DF