Gene Mvan_0472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_0472
Symbol
ID	4645578
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	514011
End bp	515036
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	63%
IMG OID	639803980
Product	dihydrodipicolinate synthetase
Protein accession	YP_951325
Protein GI	120401496
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0329] Dihydrodipicolinate synthase/N-acetylneuraminate lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACAC GTAGCAGCGA ACTCGTTCCC AGCGACATGA AGGGGCTGTG GGGATTCGTG 
CCGGCCTGCT CGACGCCGGA CGCCGCCGAT GTCAACGCGG TCGACACGAT CGACACCGAT 
GCGCTCGCGT CTCTGGTGGA TCGTCTGGTG CGTGATGGTG TCGACGGCAT CGTGACGACC 
GGCAGCGCCG GCGAGTCGCA CACCCTTTCC GACGACGAAT ACCGCACGCT CATCACGACA 
GTCGTGGAGA CGGTGAACGC CCGGGTTCCG GTGTTCGTTG GTGCCAGCAC GCTCAACACG 
CGCGACTCGA TCCGACGCGC CCGCGTCATC GCCGACCTCG GGGCGGACGG CATTATGAGC 
GGACCGCCGA TGTATTTGCC GCAGACTGCC GAGAACGCGG TCCAGTACTA TAAAGACCTC 
GCCGAGGCCG TTCCGGAGCT GGCGATTATG ATTTACCAGA ACCCGCATGC GTTCCGCATC 
ACATTGCCGC CCGGTGCATT TAGGGAGCTG GCCCAGATTC GCAATATCGT TGCGCTCAAG 
CAGACCTCGA TGGACATCTT CAATGTGATC GGCGCCATCA AAGCGGTCAA GGAAAAGATG 
TCGGTCCTCG TCTTGGACCA ATTGATGTAC CCCGCAATGA TGTTCGGTGC TGCCGGAGCG 
TGGAGCATCG ACGTATGCAT GGGCCCCTGG CCCGCGCTTT CGCTGCGCGA TGCATGCCAG 
CGTGGCGACT GGACAGAGGC CGCGGCCATC GCCGACCAGA TGCAGGCGCC ATTTCGAACG 
CTGGGTCTGA CTATGGAGGA ATTCCAAGCC ATGCAGTCCG CCTGGTGGAA GATGGCAATC 
GACACTGCGG GCTATGGGCG TGCTGGGGCT GCTCGGCCGC CCTTCGTTCA CATACCGCAG 
ACCGTCGTCG ATTCCGCGCA CCGCTACGGT GAACGCTGGG CAGGACTTGC GGAGCGCTAT 
CACCGGTCAA GGGAAGCCGC TGGGCTGCCG CCTGCCGCGG CGAACGTCGC CGCCGCCTCG 
TCATAG

Protein sequence

MTTRSSELVP SDMKGLWGFV PACSTPDAAD VNAVDTIDTD ALASLVDRLV RDGVDGIVTT 
GSAGESHTLS DDEYRTLITT VVETVNARVP VFVGASTLNT RDSIRRARVI ADLGADGIMS 
GPPMYLPQTA ENAVQYYKDL AEAVPELAIM IYQNPHAFRI TLPPGAFREL AQIRNIVALK 
QTSMDIFNVI GAIKAVKEKM SVLVLDQLMY PAMMFGAAGA WSIDVCMGPW PALSLRDACQ 
RGDWTEAAAI ADQMQAPFRT LGLTMEEFQA MQSAWWKMAI DTAGYGRAGA ARPPFVHIPQ 
TVVDSAHRYG ERWAGLAERY HRSREAAGLP PAAANVAAAS S