Gene Lcho_0593 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_0593
Symbol
ID	6159702
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	-
Start bp	643161
End bp	644264
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	72%
IMG OID	641663343
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_001789633
Protein GI	171057284
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.0144455
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCACT CCCCCGTCGT TCTGGACATC GCCGGCACCA CGCTCGACGC CGACGACCGC 
CGTCGCCTGC AGCACCCGCT CGCCGGCGGG CTGATCCTGT TTGCGCGCAA CTGGGTCGAC 
CGCCGCCAGC TGGTCACGCT GATCGCCGAG ATCAAGGACC TGCGGCCCGA CCTGCTGATC 
TGCGTCGACC ACGAAGGCGG GCGGGTGCAA CGCTTCAAGA CCGACGGGTT CACCCACCTG 
CCGCCGATGC GCGCGCTCGG CGAACGCTGG ATGCGCGACG AGCGCGGCCA GCCCGGCAGC 
GGCGCGATGC GTGCCTGCGA GGCCGCCACC GCCACCGGCT ACGTGCTGGC GGCGGAGCTG 
CGCGCCTGTG GGGTCGACCT CAGCTTCACG CCGGTGCTCG ACCTCGAACA CGCGCACAGC 
AACGTGATCG GCGACCGCGC GCTGCACCGC GACGCCCGCG TCGCCACGCT GCTGGCCAAG 
AGCCTGATGC ACGGCCTGCT GCAGGCCGGC ATGGGCAACT GCGGCAAACA TTTCCCCGGC 
CACGGCTGGG CCCGGGCCGA CAGCCACGTC GCCATCCCGC GCGACACCCG CTCGCTCAAG 
GCCATCCTGG CCGACGACGC CCTGCCCTAC GCCTGGCTGT CGAGCAGCCT GACGGCGGTG 
ATGCCGGCGC ACGTGATCTA CCCGAAGGTC GATGCGCGCC CGGCCGGCTT CTCGGCGCGC 
TGGCTGCAGG AGATCCTGCG TGACCAGTTC GGCTTCACCG GCGCCGTCTT CAGCGACGAC 
CTCAGCATGG CGGCGGCGCG CTCGGTGCCC GACGTGCAGG GCGGCGCCGA GCTGAGCTAC 
AGCCAGGCCG CGCTGCTCGC GCTGGAGGCG GGCTGCGACA TGGTGCTGCT GTGCAACCAG 
TCGCTCGGCG ACGGCGGCCG GGCCGTCGAT GAACTGCTCG ACGGCCTGGG CGACGCCATC 
GAACAAGGCC GATGGAGACC CGACCCGGAC AGCGAAACCC GCCGCATCGC CCTGCTGCCG 
CAGACCCCGC CGCTGCCGTG GGACGAGCTG ATGCACCACG CGCCCTACCA GCGCGCGCTG 
GAACTGATCG GCGAGCCGGG CTGA

Protein sequence

MNHSPVVLDI AGTTLDADDR RRLQHPLAGG LILFARNWVD RRQLVTLIAE IKDLRPDLLI 
CVDHEGGRVQ RFKTDGFTHL PPMRALGERW MRDERGQPGS GAMRACEAAT ATGYVLAAEL 
RACGVDLSFT PVLDLEHAHS NVIGDRALHR DARVATLLAK SLMHGLLQAG MGNCGKHFPG 
HGWARADSHV AIPRDTRSLK AILADDALPY AWLSSSLTAV MPAHVIYPKV DARPAGFSAR 
WLQEILRDQF GFTGAVFSDD LSMAAARSVP DVQGGAELSY SQAALLALEA GCDMVLLCNQ 
SLGDGGRAVD ELLDGLGDAI EQGRWRPDPD SETRRIALLP QTPPLPWDEL MHHAPYQRAL 
ELIGEPG