Gene Mvan_4901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_4901
Symbol
ID	4648834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	5251231
End bp	5252313
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	61%
IMG OID	639808372
Product	alcohol dehydrogenase
Protein accession	YP_955680
Protein GI	120405851
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCCATT CAGGAACCCA CAAAGTCAAG GAGACAGCAA TGAAGGCAAT GGTGTATCAC 
GGCGATGGAA AGGCTTCATG GGACGACGTA CCGGATGCCG TCCTCGTCGA TCCGACCGAC 
GCGGTGGTTC GGGTCGACGC CGTCACGATC TGCGGGACTG ACCTGCATAT CCTACGTGGC 
CATGTCCCCA CCGTGGACAG GGGACGAATC CTCGGCCACG AGGCGGTGGG AACCGTGACC 
GCGATCGGTT CAGGCGTGCG GCAGCTTGCG GTCGGTGACC GTGTGTTGAT CTCCTGCATC 
AGTTCGTGCG GGAGTTGCCG ATACTGCCGT CGCACGAGCT ATGGCCAATG CAGCGGAGGA 
GGTGGTTGGA TCCTGGGGAA TCGCATCGAC GGAACTCAGG CTGAGTTCGT GCGAGTTCCG 
TTTGCGGACA ATTCGACACA TCGGGTTCCG GACGGCGTGA GCGACGAAAA CATGATCACG 
CTGGCGGATT TGCTTCCGAC CGGGTACGAA GTGGGAGCCA TCAACGGCAG AGTCCGGCCG 
GCGGACACAG TCGTTGTCGT GGGTGCCGGG CCGATCGGCC TTGCGGCGAT CATGACGTCC 
CAGTTGTTCA GCCCCAGCCG CATCGTGGCC ATCGACCTTG CCGACAGCCG ACTGGATGCT 
GCCCGCAAGT TCGGTGCAGA CATCGTGATC AATCCCGACC GCCTAGACCC GGTTGCGGCG 
ATCGCCGACT TGACAGGCGG ATTGGGTGTT GACGCGGCCA TGGAAGCAGT CGGGACGGCC 
GCAACGTTCG AACTTGCCGT GCAACTCGTC CGTCCGGGCG GACACGTCGC CAACATCGGG 
GTGCACGGCG GGCCGGCAAC ACTTCATCTC GAAGACATCT GGATCAGGAA TCTCACCATC 
ACCACAGGCC TCGTCGACAC CTATTCGACA CCGACCCTTG TCGACCTTGT CGCCGCGCAC 
AGACTCGATA CATCCGCCCT GGTGACGCAC CGCTACCCCT TGGACGAATT CGAGCGCGCC 
TATCACGAAT TCAGTAATGC CGGCGAAACG GGAGCACTCA AAGTTCTACT GACACAGAAC 
TGA

Protein sequence

MFHSGTHKVK ETAMKAMVYH GDGKASWDDV PDAVLVDPTD AVVRVDAVTI CGTDLHILRG 
HVPTVDRGRI LGHEAVGTVT AIGSGVRQLA VGDRVLISCI SSCGSCRYCR RTSYGQCSGG 
GGWILGNRID GTQAEFVRVP FADNSTHRVP DGVSDENMIT LADLLPTGYE VGAINGRVRP 
ADTVVVVGAG PIGLAAIMTS QLFSPSRIVA IDLADSRLDA ARKFGADIVI NPDRLDPVAA 
IADLTGGLGV DAAMEAVGTA ATFELAVQLV RPGGHVANIG VHGGPATLHL EDIWIRNLTI 
TTGLVDTYST PTLVDLVAAH RLDTSALVTH RYPLDEFERA YHEFSNAGET GALKVLLTQN