Gene Namu_0040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_0040
Symbol
ID	8445619
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	46106
End bp	47761
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	71%
IMG OID	645039191
Product	urocanate hydratase
Protein accession	YP_003199467
Protein GI	258650311
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2987] Urocanate hydratase
TIGRFAM ID	[TIGR01228] urocanate hydratase

Plasmid Coverage information

Num covering plasmid clones	68
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGGTG CCCGTCCGGT CCGCGCCCCC CGGGGGACCA GCCTGACCGC CAAGTCCTGG 
ACCACCGAGG CTCCGCTGCG GATGCTGATG AACAACCTCG ATCCGGAGAA CGCCGAGCGA 
CCCGATGATC TGGTCGTTTA CGGCGGCACC GGCAAGGCCG CGCGGGACTG GAACTCGTTC 
GACGCGATGG TCCGCACGCT GACCACGCTG GAGGCCGACG AGACCATGCT GGTCCAGTCC 
GGCCGGCCGG TCGGGGTCAT GCGCACCCAC GAGTGGGCGC CGCGGGTCAT CCTGGCCAAC 
TCCAACCTGG TGCCGGACTG GGCCAACTGG CCCGAGTTTC GCCGGCTGGA GAAGCTGGGC 
CTGACCATGT ACGGCCAGAT GACGGCCGGT TCGTGGATCT ACATCGGCTC CCAGGGCATC 
GTGCAGGGCA CCTACGAGAC GTTCGCCGCC ATCGCCGAGA AGCGGTTCAA CGGCACGCTG 
GCCGGCACCC TCACGCTGAC CGGCGGAGCC GGCGGCATGG GTGGCGCCCA GCCGCTGGCC 
GTCACCCTCA ACGGCGGCGC CTGCCTGATC GTCGACGTCG ACGAGTCCCG ACTGCAGCGC 
CGGGTCGAGC ACCGCTACCT GGACGAGATC GCGGTCGACA TCGACGACGC CATCGCCAAG 
TCGCTGCAGG CCAAGGCGCA GCGCAAGGCC TGGTCGGTGG GTCTGGTCGG CAACTGCGCG 
GAGGTCTTTC CCGAGCTGCT GCGGCGCGGG GTGGACATCG ACATCGTCAC CGACCAGACC 
AGCGCGCACG ACCCGCTGTC GTACCTGCCG GCCGGCGTCT CGATCGAGGA CTGGCCCGAC 
TATGCCGAGC GCAAGCCCGA GGAGTTCACC GACCGGGCCC GGGAGTCGAT GGCCCGCCAC 
GTCGAGGCGA TGGTCGGCTT CCAGGACGCC GGCGCAGAGG TCTTCGACTA CGGCAACAGC 
ATCCGGGACG AGGCCCGGCA GGGGGGCTAC GAGCGGGCCT TCGACTTCCC CGGCTTCGTA 
CCGGCCTACA TCCGGCCGCT GTTCTGCCAG GGCAAGGGGC CGTTCCGGTG GGCTGCGCTG 
TCCGGCGACC CGAAGGACAT CTACGCCACC GACCAGGCGG TGATGGATCT GTTCCCGGAC 
AACGACCGCC TGCAGAAGTG GATGCGGGGG GCCCGCGAGA AGATCAGCTT CCAGGGTCTG 
CCGGCGCGGA TCTGCTGGCT GGGCTACGGC GAGCGGGACC GGGCCGGCCT GCGGTTCAAC 
GAGATGGTCG CGTCCGGCGA GCTGTCCGCG CCGATCGTCA TCGGCCGGGA CCACCTGGAC 
TGCGGGTCGG TCGCCTCGCC CTACCGGGAG ACCGAGTCGA TGGCCGACGG GTCGGACGCG 
ATCGCCGACT GGCCGCTGCT CAACGCGCTG ATCAACACGG CCAGCGGCGC GTCCTGGGTG 
TCCATCCATC ACGGCGGCGG CGTCGGCATC GGCCGGTCCA TCCACGCCGG CCAGGTCTCG 
CTGGCCGACG GCACGGCGCT GGCCGCCGAG AAGCTGGCCC GGGTGCTGAC CAACGACCCG 
GGCATGGGCG TGATCCGGCA CGTGGACGCC GGGTACGAGC TGGCCGAGCA GGTCGCCGCC 
GACCAGGGCG TGCGCATCCC GATGAAGGAG GGCTGA

Protein sequence

MEGARPVRAP RGTSLTAKSW TTEAPLRMLM NNLDPENAER PDDLVVYGGT GKAARDWNSF 
DAMVRTLTTL EADETMLVQS GRPVGVMRTH EWAPRVILAN SNLVPDWANW PEFRRLEKLG 
LTMYGQMTAG SWIYIGSQGI VQGTYETFAA IAEKRFNGTL AGTLTLTGGA GGMGGAQPLA 
VTLNGGACLI VDVDESRLQR RVEHRYLDEI AVDIDDAIAK SLQAKAQRKA WSVGLVGNCA 
EVFPELLRRG VDIDIVTDQT SAHDPLSYLP AGVSIEDWPD YAERKPEEFT DRARESMARH 
VEAMVGFQDA GAEVFDYGNS IRDEARQGGY ERAFDFPGFV PAYIRPLFCQ GKGPFRWAAL 
SGDPKDIYAT DQAVMDLFPD NDRLQKWMRG AREKISFQGL PARICWLGYG ERDRAGLRFN 
EMVASGELSA PIVIGRDHLD CGSVASPYRE TESMADGSDA IADWPLLNAL INTASGASWV 
SIHHGGGVGI GRSIHAGQVS LADGTALAAE KLARVLTNDP GMGVIRHVDA GYELAEQVAA 
DQGVRIPMKE G