Gene Sden_1945 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sden_1945
Symbol
ID	4018434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella denitrificans OS217
Kingdom	Bacteria
Replicon accession	NC_007954
Strand	-
Start bp	2302607
End bp	2303620
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	49%
IMG OID	637955967
Product	beta-hexosaminidase
Protein accession	YP_562951
Protein GI	91793300
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTATT TGATGATGGA TTTGCAAGGG CTAAGTGTTA GCGAGCATGA GTCAAACTTA 
TTAGCCCACC CGATGGTAGG CGGTATTATT CTGTTTACTC GTAATTTTGC TAATAAAGCG 
CAGCTTATCG AGTTAGTGCA GCAAGTCCGT GCCATTCGGC CAGAACTGCT TATCGCTGTC 
GATCATGAAG GCGGCAGGGT GCAGCGTTTT CGAGACGGCT TTAGTGCCAT TCCTGCCATG 
GGGGATATTC TACCCAGCGC TAAAGGCGAT ATGAGTTTAG CGAAACGCTG GGCTAAAGAA 
GCAGGTTTCT TAATGGCCAT AGAGCTACTG GAATGCGATA TCGACTTAAG TTTTGCCCCA 
GTGTTAGATG TTAACGGCAT TAGCCAAGTC ATAGGAAAAC GCAGCTTCAG TCCAGCCCCT 
GAGGAAATAT CTATATTAGC TAGCGAATTT ATTCATGGCA TGAATCAAGC GGGTATGGCC 
GGCGTGGGTA AACATTTTCC AGGTCACGGC AGTGTCGCCG CTGACTCACA CATTGCCATG 
CCAGTAGATA ATCGCACTAA GGATGAAATA TTTTCACATG ATATGCGGCC GTTCTCTCAA 
CTTATTAACG CTGGAATGCT GGCGGGTGTG ATGCCCGCCC ATGTGGTCTA TGCCCAGGTT 
GACCCTAACC CTGCAGGCTT CTCATCATAC TGGTTACAAC AGGTGCTTCG CGGCGAGCTT 
AATTTCAACG GGGTGATTTT CTCCGATGAT TTAGGCATGA AAGGTGCCCA TTTTGCCGGT 
GATTATCTGG GCCGCGCTAG CGCTGCATTA AATGCAGGCT GCGACATGAT CTTGGTCTGT 
AACGATCCCG CTGGGGTTGA AGTGCTATTG AATACATTTG TTTGGCCAGA GGACGCCCCT 
AAGGCCAATG CCAGCAGCCT GTTACTCAAT AATTCGCAGC GCCAGTTAGC CATTGCAGAT 
AAGCAGCGTA TCGCGTCGGC TAAGGTGATG ATGGCCAGCA TAGCCCTCGA CTGA

Protein sequence

MSYLMMDLQG LSVSEHESNL LAHPMVGGII LFTRNFANKA QLIELVQQVR AIRPELLIAV 
DHEGGRVQRF RDGFSAIPAM GDILPSAKGD MSLAKRWAKE AGFLMAIELL ECDIDLSFAP 
VLDVNGISQV IGKRSFSPAP EEISILASEF IHGMNQAGMA GVGKHFPGHG SVAADSHIAM 
PVDNRTKDEI FSHDMRPFSQ LINAGMLAGV MPAHVVYAQV DPNPAGFSSY WLQQVLRGEL 
NFNGVIFSDD LGMKGAHFAG DYLGRASAAL NAGCDMILVC NDPAGVEVLL NTFVWPEDAP 
KANASSLLLN NSQRQLAIAD KQRIASAKVM MASIALD