Gene Mvan_1006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_1006
Symbol
ID	4645791
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	1052827
End bp	1054143
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	70%
IMG OID	639804507
Product	protein of unknown function DUF1100, hydrolase family protein
Protein accession	YP_951850
Protein GI	120402021
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.342716
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGGAC ACGCCGTCGC CCGCCGACTG GTCACCAGCG GTTGTGCGCT GACCCGCACC 
ACCGAGTGGG CGGCGTCGCG ATGGGGCACG GCGTACTTCC TGCCCGCGCT GTTCGCAGAC 
CGTGTCACGC ACCTCGGTGG GATTGACAAG CGTTTTTTCG CAGAGCAATT GGCGCAGTGC 
CGCTCGTTCC GTGACGGCTC CTGGGCGGGG CATTGGCAGG CTATCGCCGC CGACCACGCC 
GGCGTCGCCG ACGCGGCCCT GGCCCGGCTC GGCGGGCCCA CCGTCGCGCA GATGCTCGCC 
GGCCCGGTCG ACACGTCCGC ACTGGGTGAG CTGCTCACCC CCGCCGTGTC GATCCTGGCC 
GACCGGGGGC CGGTGGCGTC ACCGGACGCC GTGACGACGT TCCGACTGCA CAGCGGCGGC 
GCGGGCGATG ACGCCGCGAT CGCGGTGGAT GCGCTCATCA AGGTGGTCAC GTACAAGTTC 
GCGGCGGCGT GGCCGGGCTG GACACCGCAG CGACTGAAGG CGCACGCGCA GTCACGGCGG 
CTGTGCGATG TCCTCACCGA GGCATTGGCC CCGGCGATGG GTCTGAGCAT CGAGCACCTA 
CGGGTCCCCG TCCCCGGCGG TGACGTCGTG GAGGGCGCCG CGGTGTTCCC GCTCGGTGTC 
CGTGGTTCGC CGACCGTGTT GTGCGCCAAG GGACTTGAGG GCGTCGTGGC CGAGACCCTG 
CTGCCGTGGC TGAAGTTCCG CGGGCACGGC CTGGGGATGT TCATCATGGA GATGCCGGGC 
ACCTACACCT ACCGGCAACC GCTGACCGTC GCCGCGGAGA ACGTGTATCG CGCGGTCATC 
GACCGGCTGG CGGCCGACCC CCGCGTCGAC GCAGACCGGA TCGGCATGCT GGGGCTCAGT 
TTCGGCGCAT ACTGGGCGGC CCGGATGGCC GCCGCCGATC CGCGTCTGCG CGCCGTCGTC 
GCCAACGGGG CGCCGGCGGA CCGCACGTTC CGGCCGTCGG GAGCCTTCGG CACCCCCGAG 
ATCATGATGT GGACGATGGC GAACACCACG CACGCCCGCA GCACCGCCGA CCTGCTGACC 
AAGCTGCGGG CGCTGTCGCT GAAGGACCTT TACCCGCGAA TGACCGCACC GCTGTTGGTG 
ATCAACGGCG ATTCCGACAC GCTTGCGAGT ACCCGGGACT CGATCGACAT CGCGACGTAC 
GCCCCCAACG CACTGCTCAA GCTCTACCCG GGCGACGACC ACTGCGCGAT GGGACACGCA 
CGGCAGTGGT GGGATCTGGC CGTCCGGTTC TTGGCCGACC AGCTTGGCGC TGTGTGA

Protein sequence

MAGHAVARRL VTSGCALTRT TEWAASRWGT AYFLPALFAD RVTHLGGIDK RFFAEQLAQC 
RSFRDGSWAG HWQAIAADHA GVADAALARL GGPTVAQMLA GPVDTSALGE LLTPAVSILA 
DRGPVASPDA VTTFRLHSGG AGDDAAIAVD ALIKVVTYKF AAAWPGWTPQ RLKAHAQSRR 
LCDVLTEALA PAMGLSIEHL RVPVPGGDVV EGAAVFPLGV RGSPTVLCAK GLEGVVAETL 
LPWLKFRGHG LGMFIMEMPG TYTYRQPLTV AAENVYRAVI DRLAADPRVD ADRIGMLGLS 
FGAYWAARMA AADPRLRAVV ANGAPADRTF RPSGAFGTPE IMMWTMANTT HARSTADLLT 
KLRALSLKDL YPRMTAPLLV INGDSDTLAS TRDSIDIATY APNALLKLYP GDDHCAMGHA 
RQWWDLAVRF LADQLGAV