Gene Mkms_3788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3788
Symbol
ID	4611723
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	4001921
End bp	4003174
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	70%
IMG OID	639793468
Product	amidohydrolase
Protein accession	YP_939771
Protein GI	119869819
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.463322
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.142834
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGGTC CGACCGTTCT CAAAGCGGCC CGCTGGGCCG ACGTCGAGGC CGGCGTCGTC 
CGCGCACCGG CCGTCGTGGT GATCGAGGGT AACCGCATCC AGTCCGTGAA TCCCGCTGAG 
CCGCCGCAGA ATCCGGCTCA GGAGATCGAC CTCGGCGACG TCACCCTGCT GCCCGGCCTG 
ATGGACATGG AGCTGAACCT GCTCATCGGC GGACCCGGGG GGCCGGAGGG TCTGCCCAGT 
CCGATGCACG GGGTGCAGGA CGACCCGGTG TACCGCACGT TGCGGGCGGC GGTGAACGCC 
CGCACCACAC TCGACGCCGG ATTCACCACC GTGCGCAATC TGGGGCTGAT GGTCAAGACC 
GGCGGCTACC TGCTCGATGT GGCGCTCCAA CGCGCCGTCG ACCAGGGCTG GCACGCCGGC 
CCGCGGATCT ACCCGGCCGG CCACGCCGTC ACCCCGTACG GCGGCCACCT GGATCCGACG 
GTCTTCCAGC GCCTGGCACC GGGGATCATG CCGCTGTCGG TGGCCGAGGG GATCGCCAAC 
GGCGTCGACG ACGTGCGGAC CTGCGTGCGT TACCAGATCC GCCACGGCGC CAAGTTGATC 
AAGGTCTCGG CCTCCGGTGG GGTGATGTCG CACAGCACCG CCCCCGGCGC GCAGCAGTAC 
TCCGACGACG AGTTCGCCGC GATCGCCGAC GAGGCCCACC GCGCCGGGGT ACGGGTCGCC 
GCACATGCGG TGGGGGACAG CGCGATCCGC GCCTGTATCC GCGCCGGGAT CGACTGCATC 
GAACACGGCT TCCTTGCCAC GGACGAGACG ATCCAGATGA TGGTCGATCA CGGCACGTTC 
CTCGTCTCGA CCACCTATCT CACCGAGGCG ATGGCGGTCG ACCGCATCGC ACCCGAGCTG 
CGCCGCAAGG CCGAGGAGGT GTTTCCCCGG GCTCAGGCGA TGCTGCCGAA GGCGATCGCC 
GCCGGTGTGC GCATCGCGTG CGGCACCGAC GCCCCGGCGG TGCCGCACGG ACAGAACGCC 
AAAGAGCTGT GTGCGCTCGT GTCCCGGGGC ATGACGCCCA TGCAGGCGCT GCGCGCGGCG 
ACCATCACGT CCGCAGAGCT CATCGAGGCC GACGGCGAAC TCGGCCGGCT CGCCCCCGGC 
TATCTCGCCG ACATCATCGC GGTGCCCGGC GATCCGTCGA GCGACATCGC GACCACGCTC 
GACGTGCGGT TCGTGATGAA GGACGGTGTC GTCCACAAGC GCGGCACCGT CTGA

Protein sequence

MTGPTVLKAA RWADVEAGVV RAPAVVVIEG NRIQSVNPAE PPQNPAQEID LGDVTLLPGL 
MDMELNLLIG GPGGPEGLPS PMHGVQDDPV YRTLRAAVNA RTTLDAGFTT VRNLGLMVKT 
GGYLLDVALQ RAVDQGWHAG PRIYPAGHAV TPYGGHLDPT VFQRLAPGIM PLSVAEGIAN 
GVDDVRTCVR YQIRHGAKLI KVSASGGVMS HSTAPGAQQY SDDEFAAIAD EAHRAGVRVA 
AHAVGDSAIR ACIRAGIDCI EHGFLATDET IQMMVDHGTF LVSTTYLTEA MAVDRIAPEL 
RRKAEEVFPR AQAMLPKAIA AGVRIACGTD APAVPHGQNA KELCALVSRG MTPMQALRAA 
TITSAELIEA DGELGRLAPG YLADIIAVPG DPSSDIATTL DVRFVMKDGV VHKRGTV