Gene Strop_3430 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_3430
Symbol
ID	5059899
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	3937947
End bp	3939701
Gene Length	1755 bp
Protein Length	584 aa
Translation table	11
GC content	73%
IMG OID	640475679
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_001160239
Protein GI	145595942
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3525] N-acetyl-beta-hexosaminidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0765311
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCACCCCA CCCCCGCCAC CTCGCCGCAG CAGCCGGAGC ACCGGCCCGC ACCCGCGACC 
TCGGGCGCGA CGGGCACCGT GCCGGCCACC GACGGCGGCA CGAGCATCCC GACGACGTCC 
CGCCCAGCGA CCGCCCAGCC GGCAGCGGGC GAGCTGGCCC GGCTGGCGGC CCACGAAGCA 
GGCACCGGAC TCGCCCCCGC CCCGGTCCGG CTGGGCGACG TGGTGCCCGC ACCCGAACAG 
GTGCGACCGG ATCCCCGCGC CGACTTCACA CTGTCGGCCG ACACGACAGT CCGGGTCAGC 
CCCGAACCCG ACGCGCGGGC CGTCGCCGAA CGCCTCGCCG ACCTGCTCCG GCCGGCCACC 
GGATATCGGC TCCCGATCAC CGAAGCGCAG CACCCCGAGC TGGCCGACGA CATCGCGCTC 
GTCCTCGTGC AGCAGCCCGA CCTCGGCCCC GAGGGCTACC GACTCGACGT CACGCCGACC 
GGCGTCCGGA TCAGTGCCGC CACGGCGGCC GGGCTCCACC ACGGCATCCA AACCCTGCGC 
CAGCTCCTCC CGGCCACGAT CGAGAGCAGC ACTCCGGTCC GCGCCGCCTG GACGCTGCCC 
GGTGGATCGA TCACCGACCG GCCACGCTTT CCGTACCGGG GCGCCATGCT CGACGTGGCC 
CGCCACTTCT TCGGGGTCGA CGACGTCCTG CGGGTGATCG ACCATCTCAC CCGCTACAAG 
CTCAACCACC TGCATCTGCA CCTCACCGAT GACCAGGGTT GGCGGATCGC GGTCGAGTCC 
CGGCCGCGAC TGACCACAAT CGGCGCCCAC ACGGCGGTCG GTGGCTCCCC CGGCGGGTGG 
TACACCCCGG CCGACTACCA GCGGATCGTC GCGTACGCGG GCGAGCGGCA CCTCACCGTC 
GTTCCGGAGA TCGACCTGCC GGGGCACACC AACGCCGCGC TGACCGCCTA CCCGGAGCTG 
GCCCCGGAGG GGACCACACC GGTGCCCTAC ACCGGCACCG ATGTCGGCTT CAGCTACTTG 
GACCCGACCA ACGCACAGAC GTACGAATTC GTCGCCGACG TGCTGGGGGA GGTCGCCGCG 
CGCACTCCCG GGCCGTTCCT GCACATCGGC GGCGACGAGG CCTTCGCAGT AAAGGGAGCG 
GCGTACACCG GATTCGTCGA GCGGGCGCAA CGCATCGTGG CCGAGTTCGG CAAGACGGTG 
GTGGGCTGGC ACCAGCTGGC TCCGGCAGCC CACAGCGAGG GGCGGGTACT CCAGTGGTGG 
GGCACCGACG GCGTCGACCC GACGACCGCC GACGCGGTCC GCCGAGGCGC CCGGCTGATC 
CTCTCCCCCG GCAACCACGC GTATCTGGAC ATGAAGTACA CCTCCGACAC CCCGATCGGG 
CATGACTGGG CTGGCCTGAT CGACGTACGG CGGGCGTACG ACTGGGATCC GGCGACCCGG 
GTGACGGAGG TGCCGGCGGA GGCGGTGCTG GGCGTGGAGG CCCCGCTCTG GACCGAGTCG 
GTCACCTCGC TGGCGGAGAT CGAGTTCATG CTCCTGCCCC GGCTGCCCGC CATCGCGGAG 
CTGGGCTGGT CACCGCGGGC CACCCACGAC TGGGCGGCGT TCCGCACCCG GTTGGCCGGG 
CACGGACCCC GCTGGACGGC AGCCGGGATC GCCTTCCACC GCTCCCCCGA GATCCCCTGG 
CCAACAACGC CCGCCGACCC GCCGACGGCG CAGGTCGCGC CACCCGCGCC GCGTCCCCGT 
ACCGGGCGGG GATAG

Protein sequence

MHPTPATSPQ QPEHRPAPAT SGATGTVPAT DGGTSIPTTS RPATAQPAAG ELARLAAHEA 
GTGLAPAPVR LGDVVPAPEQ VRPDPRADFT LSADTTVRVS PEPDARAVAE RLADLLRPAT 
GYRLPITEAQ HPELADDIAL VLVQQPDLGP EGYRLDVTPT GVRISAATAA GLHHGIQTLR 
QLLPATIESS TPVRAAWTLP GGSITDRPRF PYRGAMLDVA RHFFGVDDVL RVIDHLTRYK 
LNHLHLHLTD DQGWRIAVES RPRLTTIGAH TAVGGSPGGW YTPADYQRIV AYAGERHLTV 
VPEIDLPGHT NAALTAYPEL APEGTTPVPY TGTDVGFSYL DPTNAQTYEF VADVLGEVAA 
RTPGPFLHIG GDEAFAVKGA AYTGFVERAQ RIVAEFGKTV VGWHQLAPAA HSEGRVLQWW 
GTDGVDPTTA DAVRRGARLI LSPGNHAYLD MKYTSDTPIG HDWAGLIDVR RAYDWDPATR 
VTEVPAEAVL GVEAPLWTES VTSLAEIEFM LLPRLPAIAE LGWSPRATHD WAAFRTRLAG 
HGPRWTAAGI AFHRSPEIPW PTTPADPPTA QVAPPAPRPR TGRG