Gene Mvan_1054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_1054
Symbol
ID	4645365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	1107057
End bp	1108547
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	70%
IMG OID	639804555
Product	glycosidase, PH1107-related
Protein accession	YP_951898
Protein GI	120402069
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2152] Predicted glycosylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATCCA CCGGGATCCA GCTCGTGACC CGCAGCCCGC AGCGGGTTGC GGCCGACCCG 
GGCCGCGTGG TCACCCGGCT GTTCGTGCCG GGCCACGAGG GGTTCGAGCA TCAGGAGTCC 
CGTGCGGGGG CGGTGCTGTC GCGGATCCTG GCCCTGACCG ACGACGAGGT GCGGGCGGCC 
CTGCAGGATG TGCTGATCCG CTTCGACGGG CGTCACCGTG ATCTGACCGG CACCTTCCGC 
CGGCACGCCA GGGAGCTCGC CGACCGGCTC GACCCCACCC GGGAGTTCAC CGAGGCGCGC 
GTGCTGCTGC TGGGGGCCAC GTTCACCAAC GAGTACTCGA TCGAGGGTGC GGCACTGTGC 
AATCCGAGCG TCGTCGCGCA CCCCGACCAG TCCGGCACCG TCCCGGGCAG CCTGCGGTTC 
GTGATGAGCG TCCGGGGGAT CGGGGAGGGA CACCGTTCGA GCATCGGGTT CCGGACGGGC 
GTCGTCGACT CGACGGGTCA CGCCACGATC GACGAGCCTG CTCCGTTCGC CTCCACCGGA 
CGGGTCGAGC CCACCCTGCT GGACGCCGCC GTCTTCCGCA CCGAACTCCG TGACAAGGGC 
TGCGGCGGCG AGGCCGCCGA CTACGTCTTC GATGCGCTCG GTGCGCTGTT CACCAGGTCC 
GACCTGGACG AGCGGCTCGA AAGACTGCGC GCCCACCTGA GCACACGCGG ACATGTCGAG 
GACACGATCG CGACCATCCG CGGTGTCGCC GCTCGCTGTT ACGCGGTCGA GTTCCCGGAT 
GACACAACAC TTTCCGAGCG GGTGCTGTGG CCGGAGATGG AGGCCGAACA CGCCGGCATG 
GAGGACGCCC GCTTCGTGCG TTTCGTCGAC GACGACGGTT CGATCCGCTA CCACGCGACG 
TACACCGCCT ACAGCGGATC GCACATCAGC CAGCAACTGC TCACCACCGC GGACTTCCAG 
ACCTTCACCT CCGGGCCCCT CGTCGGGAGT GCCGCCGCCA ACAAGGGGCT GGCGTTGTTC 
CCTCGCCGCA TCGGCGGCCG GTACGCCGCG ATGTCGAGGT CGGACCGCGA GACCAACACC 
GTCGCCTTCG CCGATGATCT GTCGGTCTGG ACCACGGCGT TGCCCTGCCA ACAGCCGGCC 
GAGGTGTGGG AGACGCTGCA ACTCGGAAAC TGCGGTCCGC CGATCGAGAC CGACAGGGGC 
TGGCTGCTGT TGACCCACGG CGTCGGGCCG ATGCGCACGT ACAGCATCGG GGCGATCCTG 
CTTGACCTCG ACGATCCGAC CCGGGTGATC GGACGACTGC GACGGCCCCT GCTGACCCCG 
GCGGCCGACG ACCGGGACGG GTATGTGCCC AACGTGGTGT ACTCGTGCGG CGCGCTCGTC 
CACGCGGACA CCCTGGTGAT CCCGTACGGG ATCTGCGACA GCGCCATCGG TCTCGCGACG 
GTCCCGCTCC CGGACCTGCT GGCCGAGCTC GCCGGGTCGC CTCGGCACTG A

Protein sequence

MTSTGIQLVT RSPQRVAADP GRVVTRLFVP GHEGFEHQES RAGAVLSRIL ALTDDEVRAA 
LQDVLIRFDG RHRDLTGTFR RHARELADRL DPTREFTEAR VLLLGATFTN EYSIEGAALC 
NPSVVAHPDQ SGTVPGSLRF VMSVRGIGEG HRSSIGFRTG VVDSTGHATI DEPAPFASTG 
RVEPTLLDAA VFRTELRDKG CGGEAADYVF DALGALFTRS DLDERLERLR AHLSTRGHVE 
DTIATIRGVA ARCYAVEFPD DTTLSERVLW PEMEAEHAGM EDARFVRFVD DDGSIRYHAT 
YTAYSGSHIS QQLLTTADFQ TFTSGPLVGS AAANKGLALF PRRIGGRYAA MSRSDRETNT 
VAFADDLSVW TTALPCQQPA EVWETLQLGN CGPPIETDRG WLLLTHGVGP MRTYSIGAIL 
LDLDDPTRVI GRLRRPLLTP AADDRDGYVP NVVYSCGALV HADTLVIPYG ICDSAIGLAT 
VPLPDLLAEL AGSPRH