Gene Mvan_3953 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_3953
Symbol
ID	4646244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	4225104
End bp	4226369
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	72%
IMG OID	639807415
Product	saccharopine dehydrogenase
Protein accession	YP_954736
Protein GI	120404907
COG category	[S] Function unknown
COG ID	[COG3268] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0682928
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCAA ACGAAGCACA CGACCGGGAG CACGACATCG TTGTCTACGG CGCCACCGGG 
TTCGTCGGGA AGCTGACGGC GCAGTATCTC GCCGCCGCGG GAGCCGGCGC CCGTATCGCG 
CTGGCGGGCC GCTCCACCGA TCGCCTGCTG GCGGTGCGGG AATCGCTGGG GGAGGCCGCG 
CAGGACTGGC CGCTGCTCGT CGCGGACGCG TCGCAGCCCT CGACGCTCAA CGCGATGGCG 
GCCAGCACCC GCGTGGTGAT CACCACGGTC GGTCCCTACC TGCGCTACGG GCTGCCGCTT 
GTCGCGGCGT GCGCGGCCGC GGGCACCGAC TACGCGGATC TCACCGGGGA GACGCTGTTC 
GTGCGCGAGT GCATCGACCT GTACCACAAG CAGGCCGCCG ACACGGGAGC GCGCATCGTG 
CACGCGTGCG GGTTCGACTC CATCCCGTCG GATATGACCG TGTTCGCGCT GTACCGGGCC 
GCCGAACGCG ACCGCACCGG TGAGCTCGGC GACACCAATT TCGTCGTCCG CTCCTTCGCC 
GGCGGGGTAT CCGGCGGCAC GGTGGCGTCG ATGACCGAGC TGGCTCGCCA GGCATCGCAG 
GACCCCGAGG CCCGGCGCCT GCTCAACGAC CCGTACACGC TCACCCCCGA CCGTGCGGCC 
GAGCCCGAAC TCGGAGCCCA GCCCGACGCG CGGTGGCGGC GGGGCCGCGA GATCGCCCCG 
GAACTGGACG GCTACTGGGT CGGCGCGTTC GCGATGGCGC TGCCCAACAC CCGCGTCGTC 
CGGCGCAGCA ACGCGCTTCT GGGCTACGCG TACGGCAGGC GGTTCGAATA CGCCGAACAG 
ATGAGCACCG GCCGTTCCGT GGGCGCGCCG CTGGTCGCCG CCATGGCCAC GGCGGGCAAC 
GTCGCGACGA TGGAGCTCAG CAGTCGCTTC CTGGACCGGG TGCCGCGGGG CGCGCTCGAG 
CGCATCCTCC CCAAGGTTGG TACCGGGCCC AGCGAACAGA CCCGTGAACG CGGGCACTAC 
ACCGTCGAGA CCTACACCAC GACGTCGACC GGCGCCCGCT ACCTCGCCCG GATGTCCCAG 
CAGGGCGACC CCGGCTACAA GGCCACGTCG GTGCTGCTCG GCGAGAGCGG CCTGGCCCTT 
GCGCTGGACC GCGACAAGCT GTCCGACCTG CGCGGGATCC TGACCCCGGC CGCCGCCATG 
GGGGATGCGC TGCTGGCCCG GTTCCCGGCC GCGGGGGTGT CGCTGGACGT GTCCAGGCTG 
AACTGA

Protein sequence

MSANEAHDRE HDIVVYGATG FVGKLTAQYL AAAGAGARIA LAGRSTDRLL AVRESLGEAA 
QDWPLLVADA SQPSTLNAMA ASTRVVITTV GPYLRYGLPL VAACAAAGTD YADLTGETLF 
VRECIDLYHK QAADTGARIV HACGFDSIPS DMTVFALYRA AERDRTGELG DTNFVVRSFA 
GGVSGGTVAS MTELARQASQ DPEARRLLND PYTLTPDRAA EPELGAQPDA RWRRGREIAP 
ELDGYWVGAF AMALPNTRVV RRSNALLGYA YGRRFEYAEQ MSTGRSVGAP LVAAMATAGN 
VATMELSSRF LDRVPRGALE RILPKVGTGP SEQTRERGHY TVETYTTTST GARYLARMSQ 
QGDPGYKATS VLLGESGLAL ALDRDKLSDL RGILTPAAAM GDALLARFPA AGVSLDVSRL 
N