Gene Mvan_4020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_4020
Symbol
ID	4647476
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	4301177
End bp	4302205
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	67%
IMG OID	639807482
Product	inositol 2-dehydrogenase
Protein accession	YP_954803
Protein GI	120404974
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.141873
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.256136
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAGC TTCGTGTGGC CGTGTTGGGT GTGGGCGTGA TGGGCGCCGA CCACGTCGCC 
CGGATCACCT CCCGGATCTC CGGGGCCCGG GTGTCGGTCG TCAACGACTA CGTCACCGAG 
AAGGCCGAGC AGATCGCCTC GGAGGTCGAC GGCTGTCGCG CGGTGGTCGA TCCGCTGGAT 
GCGATCGCCG ATCCCGAGGT GGACGCGGTG GTGCTGGCCA CTCCCGGCAG CACCCACGAG 
AAGCAGCTGC TGGCCTGCCT GGATCACAGA AAACCGGTGA TGTGCGAGAA GCCGCTCACC 
ACCGATGTTT TCACCTCACT GGAGATCGCC CGGAGGGAGG CGGAGCTCGA GTGCCCGCTG 
ATCCAGGTCG GGTTCATGCG CCGGTTCGAC GACGAGTACA TGCGTCTCAA GGCACTGCTC 
GACGGCGGCG AACTCGGACA GCCCCTGGTG ATGCACTGCG TGCATCGCAA CCCGGGCGTG 
CCGTCGTACT TCGACAGTTC GCTGATCGTC AAGGACTCCC TGGTTCACGA GGTCGACGTG 
ACGCGGTACC TGTTCGGCGA AGAGATCGCC AGCGTGCAGA TCGTCAGACC CGTCTCGAAT 
CCCGCTGCGC CAGAAGGGGT CATCGACCCG CAGATCGCGA TCCTGCGCAC CGTCTCCGGG 
CGGCACGTGG ACGTGGAACT GTTCGTGACC ACCGGTGTCG CCTATGAGGT CCGCACCGAG 
GTGGTCGGCG AACGCGGCAG CGCGATGATC GGCTTGGACG TCGGGCTCAT CCGCAAGAGT 
GCACCCGGCA CGTGGGGCGG TCTGATCGCC CCCGGCTTCC GGGAGCGCTT CGGCCGCGCG 
TACGACACCG AAATCCAGCG CTGGGTCGAC GCGGTGCGGG CCGGCACCAA CATCGACGGT 
CCGACCGCCT GGGACGGTTA CGCCGCCGCG GCGGTGTGCG CCGCGGGCGT CGAATCACTC 
GAGTCGGGAT TGCCCGTCCC GGTGCACCTT GCTGAACGAC CTGACCGCTC CACGATCAGG 
CCCCGTTGA

Protein sequence

MSELRVAVLG VGVMGADHVA RITSRISGAR VSVVNDYVTE KAEQIASEVD GCRAVVDPLD 
AIADPEVDAV VLATPGSTHE KQLLACLDHR KPVMCEKPLT TDVFTSLEIA RREAELECPL 
IQVGFMRRFD DEYMRLKALL DGGELGQPLV MHCVHRNPGV PSYFDSSLIV KDSLVHEVDV 
TRYLFGEEIA SVQIVRPVSN PAAPEGVIDP QIAILRTVSG RHVDVELFVT TGVAYEVRTE 
VVGERGSAMI GLDVGLIRKS APGTWGGLIA PGFRERFGRA YDTEIQRWVD AVRAGTNIDG 
PTAWDGYAAA AVCAAGVESL ESGLPVPVHL AERPDRSTIR PR