Gene Mvan_1920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_1920
Symbol
ID	4648011
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	2048639
End bp	2050141
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	70%
IMG OID	639805407
Product	putative short chain dehydrogenase
Protein accession	YP_952746
Protein GI	120402917
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCGAAC TTATTCGAAC GTCGGGGATC CCGTCACCCC TGCTAGTGGA GATGGGGTTC 
ATGGAGAGCC CGTACGCTTC CCGGGTGAAC GCGATCGATC CGGACAAGCT CATCACCTGT 
CTGCAGGTGC TGGCCGACAT CGAGGCCCTG CCTCCCGAGC ACCCCGATGC CGTCGCTGTC 
CGCCGGGCCA CGGCCGGCAT CTTCAAATCG GTGAGAAAGG CTCGTCGCGC CGCCAAGCGC 
GACGCCGTGG CCGCCGCCGA CGACGCCATC ACCGCGGCCA CCGCCACCGG TGCGCCCGGC 
CGCATCGACG ACGAGACGCA GGGTCTGCCG CTGGTGTCCA CCACCGTCGG CGCCACCGCC 
GGCACGCTGC TGCGTCCGCG CGCCTGCTAC ATCTGCAAGA ACCGGTACAC CGTGGTCGAC 
GCGTTCTACC ACCAACTCTG CCCCGACTGC GCTGCCCTGA ACCGGGCCAA GCGCGACGCC 
CGCACCGACC TCACCGGCAG GCGCGCCCTG CTCACCGGCG GTCGCGCCAA GATCGGCATG 
TACATCGCCC TGCGACTGCT GCGCGACGGC GCCCACACCA CCATCACCAC CCGCTTCCCC 
AACGATGCCG TGCGCCGTTT CGCAGCGATG CCCGACAGCG CCGACTGGCT GCACCGACTG 
CGGATCGTCG GTATCGACCT GCGGGACCCG GCGCAGGTGG TCGCCCTCGC CGACGCCGTG 
GCCGCGCAGG GCCCGCTGGA CATCCTGATC AACAACGCCG CGCAGACCGT GCGCCGGTCG 
CCCGGTGCCT ATGCGGCACT CGTCGAGACG GAACGCACGC CGCCGCCGGA GATCGTGGAC 
GTGCTGACGT TCGACCGGGT CAGCGACGCC CACCCGGCCG CGCTCGCCGG CAGCCTGGCC 
GCAAACCCCA CTCCGCACCA GGTGGCCGAG CTGGCGCTGA CTGCCCGCAG CGCCTCCCCG 
GACCGGATCG CCGCGGGCAC CGCCATCGAC GCGGGCGGCC TGCTGCCCGA CACGGCCCCG 
GTGAACAGCT GGACCCAGCG GGTCCACGAG GTCGACGCGA TGGAACTGCT GGAGGTGCAG 
CTGTGCAACC AGACCGCGCC GTTCATCCTG GTGAGCCGGC TGCGCCCGGC GATGGCCGCC 
GCACCTGCGC GTCGCACCTA CGTCGTGAAT GTCTCCGCGA TGGAGGGTCA GTTCAGCCGG 
GCATACAAGG GCCCGGGTCA TCCGCACACC AACATGGCCA AGGCCGCGCT GAACATGCTG 
ACCCGCACGA GCGCCGGTGA GATGTTGGAG CGCGACGGCA TTCTGATGAC CGCCGTGGAC 
ACCGGCTGGA TCACCGACGA GCGCCCGCAC CCGACGAAGC TGCGGCTCGC AGAGGAGGGG 
TTTCACGCCC CGCTGGACCT GGTCGACGGG GCTGCGCGCG TGTACGACCC GATCGTGCGC 
GGCGAGGCCG GCGAAGATCT GCACGGCTGC TTTTTGAAGG ACTACTCGCC GTCCAACTGG 
TAG

Protein sequence

MSELIRTSGI PSPLLVEMGF MESPYASRVN AIDPDKLITC LQVLADIEAL PPEHPDAVAV 
RRATAGIFKS VRKARRAAKR DAVAAADDAI TAATATGAPG RIDDETQGLP LVSTTVGATA 
GTLLRPRACY ICKNRYTVVD AFYHQLCPDC AALNRAKRDA RTDLTGRRAL LTGGRAKIGM 
YIALRLLRDG AHTTITTRFP NDAVRRFAAM PDSADWLHRL RIVGIDLRDP AQVVALADAV 
AAQGPLDILI NNAAQTVRRS PGAYAALVET ERTPPPEIVD VLTFDRVSDA HPAALAGSLA 
ANPTPHQVAE LALTARSASP DRIAAGTAID AGGLLPDTAP VNSWTQRVHE VDAMELLEVQ 
LCNQTAPFIL VSRLRPAMAA APARRTYVVN VSAMEGQFSR AYKGPGHPHT NMAKAALNML 
TRTSAGEMLE RDGILMTAVD TGWITDERPH PTKLRLAEEG FHAPLDLVDG AARVYDPIVR 
GEAGEDLHGC FLKDYSPSNW