Gene Mmar10_0601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_0601
Symbol
ID	4283773
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	+
Start bp	696098
End bp	697243
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	65%
IMG OID	638140066
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_755832
Protein GI	114569152
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0823164
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGGTG CGGGGAAAAC GAGTGACGGA AAGCGTATCA TGGATCGACG GCGCGTCTTG 
AAATCGGGTA TCGCGGCCAC ACTGACGGCG GCGTTTGGGC CGGCTGCCGG TGCCCTGGTC 
CGCGAAGCCA TGGAACGGCC CCTGGCCGAG CGCGTCGGCG ACATGTTGCT GATGGGCTTT 
ATCGGCTCGC ATTCGGAGAC GGAAGGTGCC GACATCATCG ACGCCCATCT GGCGGCCAAG 
CGGATCGGCG GCGTGCTCTT CCTGCGCCAT AATGTGCGCT CACGTGAGGG TGCTGAGGGA 
TCCGCGGCCC GTTTTCGCGC TACAAGCCCG TCATCCTGGA TGGCTATCGA TCAGGAAGGC 
GGTCTGGTCC AGCGCCTGTC GCGTGATCTG GGCTACACCC ATATTCCGCG GGCCATGCAG 
GTCGCCGAAG CCCGCTCACC CGAATCCGCA GGCGATCTCT ATCGGCTCGG CGCCGCCGAG 
TTTCACGCCG CCGGCTTCAA CATGAATCTG GCGCCGGTTG CCGACCTCCA CGATCCCGAC 
AATGCGGTGA TCGGTCGGCA CGGGCGGGCC TATGGCGCGG ATGGCGAGAC CATCGCCGCC 
TATGCCGGTG CCTTCATCGA CGCTTTCGAG GCCTTTGGCA TCGCCTGCGC GATCAAGCAC 
TTCCCCGGAC ATGGCCGGTC GCGCGGTGAC AGTCATGACG GTTTTGTCGA TATTTCCGAC 
AGCTGGAGCG AGGCCGAGCT GGCGCCTTTC CGCCAGTTGA TCGAGCGGGG TCAGGCGCAT 
GTCATGATGG GCGGGCACCT GACCAATCGG CAGCTCGACC CGACCGGCGC GCCGGTGACC 
TTCTCGGCAC CGGTATTGGA AGGCCTCTTG CGCGATCAGC TCGGCTTCAC CGGCGTGATG 
ATGACGGATG ATCTCGACAT GGGCGCGATC CGCAATAATT ACAGCCAGCA CGAGGCGGTG 
ATCAGCGCCA TCGAGGCCGG CAATGACATG ATCATGCTGT CCAACTCCGC CGCCCCCGAT 
GCCGAACTCC CGCAACGCAT TGTCGGCTGG GTAGAGGCGG CCATCAGCGA GGGTCGGCTG 
ACCGAACACC GGATCAACCA GTCGGTCGCC CGCCTGGCCG TGCTGAAGGC GCGGGTGGGG 
CTCTAG

Protein sequence

MFGAGKTSDG KRIMDRRRVL KSGIAATLTA AFGPAAGALV REAMERPLAE RVGDMLLMGF 
IGSHSETEGA DIIDAHLAAK RIGGVLFLRH NVRSREGAEG SAARFRATSP SSWMAIDQEG 
GLVQRLSRDL GYTHIPRAMQ VAEARSPESA GDLYRLGAAE FHAAGFNMNL APVADLHDPD 
NAVIGRHGRA YGADGETIAA YAGAFIDAFE AFGIACAIKH FPGHGRSRGD SHDGFVDISD 
SWSEAELAPF RQLIERGQAH VMMGGHLTNR QLDPTGAPVT FSAPVLEGLL RDQLGFTGVM 
MTDDLDMGAI RNNYSQHEAV ISAIEAGNDM IMLSNSAAPD AELPQRIVGW VEAAISEGRL 
TEHRINQSVA RLAVLKARVG L