Gene Mvan_1017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_1017
Symbol
ID	4644238
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	1066865
End bp	1068202
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	69%
IMG OID	639804518
Product	glucarate dehydratase
Protein accession	YP_951861
Protein GI	120402032
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID	[TIGR03247] glucarate dehydratase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0552689
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.150619
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAACCC CTGTCATCAC CGACGTCACC GTTGTACCGA TCGCCGGTCA CGACAGCATG 
CTGTTGAACC TCTCCGGCGC GCACGGCCCG TTCTTCACCC GCAACCTCGT CATCGTCGAG 
GACTCCGAAG GCAACACCGG AGTCGGCGAG GTGCCGGGCG GTGAGCCGAT CCGCCGGACG 
CTGCAGGATG CGCGAGGGAT CGTCACCGGC CGCAGCATCG GCGACTACCA CGCCGTCCTC 
AACGAGATGC GCCGCACCTT CGCCGACCGC GACGCCGGCG GTCGCGGCGC CCAGACCTTC 
GACCTGCGGG TGACCGTACA TGCAGTCACC GCAATCGAAT CCGCGCTGAT GGACCTGCTC 
GGCCAGCACC TGGAGGTGCC GGTGGCCGCG CTGCTCGGCG ACGGGCAGCA GCGGTCGCGG 
GTGCAGGCGC TGGGTTACCT GTTCTTCGTC GGGGACCGCA CCCGGACCGA CCTCGCGTAC 
CGCTCCCCGT CCGACGAGGA GCCTGGGGCC GACGACTGGT TCACCGTCCG CCACGAGGAG 
GCGATGACCC CCGACGCGGT GGTCCGACTC GCCGAGGCCG CCCGCGCCCG CTACGGGTTC 
GCCGACTTCA AGCTCAAGGG TGGTGTGCTG CCCGCGGCCG ACGAGGCCAA AGCGGTCATC 
GCGCTGGCCG AGCGGTTCCC CGATTCTCGA ATCACGCTGG ACCCCAACGG AGGCTGGCTG 
CTGGCCGACG CGATCAGGAC ATGCCGCGAG CTCAAAGACG TGCTGGCCTA CGCCGAGGAC 
CCGGTCGGAC CGGAAGACGG GTTCTCCGGA CGCGAGGTGA TGGCAGAGTT CAAGCGCGCC 
ACCGGCCTGC CGACCGCGAC CAACATGATC GCCACCGACT GGCGAGAGAT GGGTCATGCC 
ATCCGATCCG GCGCCGTGGA CATCCCGCTG GCCGACCCGC ACTTCTGGAC GATGACCGGC 
TCCGTGCGCG TCGCGCAGCT CTGCGATGCC TGGGGACTGA CATGGGGTTC GCACTCCAAC 
AACCACTTCG ACGTTTCGCT GGCGATGTTC ACCCATGTCG CCGCCGCCGC GCCCGGTGAC 
ATCACCGCGA TCGACACACA CTGGATCTGG CAGGACGGCC AGGCGATCAC CACGAATCCG 
TACCCGATCG TCGACGGCTA CCTGAGCGTG CCGGACGCCC CCGGCCTCGG CGTCACGCTC 
GATGAGCCCG CGGTGCAGGC CGCGCACGCG CTGTACCAAC GGGAGGGGCT CGGCGGCCGT 
GACGACGCCG TCGCGATGCA GTACCTCATC CCGGGCTGGA CGTTCGACGG CAAGCGACCC 
GCGCTGGACC GGGGATGA

Protein sequence

MRTPVITDVT VVPIAGHDSM LLNLSGAHGP FFTRNLVIVE DSEGNTGVGE VPGGEPIRRT 
LQDARGIVTG RSIGDYHAVL NEMRRTFADR DAGGRGAQTF DLRVTVHAVT AIESALMDLL 
GQHLEVPVAA LLGDGQQRSR VQALGYLFFV GDRTRTDLAY RSPSDEEPGA DDWFTVRHEE 
AMTPDAVVRL AEAARARYGF ADFKLKGGVL PAADEAKAVI ALAERFPDSR ITLDPNGGWL 
LADAIRTCRE LKDVLAYAED PVGPEDGFSG REVMAEFKRA TGLPTATNMI ATDWREMGHA 
IRSGAVDIPL ADPHFWTMTG SVRVAQLCDA WGLTWGSHSN NHFDVSLAMF THVAAAAPGD 
ITAIDTHWIW QDGQAITTNP YPIVDGYLSV PDAPGLGVTL DEPAVQAAHA LYQREGLGGR 
DDAVAMQYLI PGWTFDGKRP ALDRG