Gene Namu_1421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1421
Symbol
ID	8447017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	1568293
End bp	1569837
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	75%
IMG OID	645040552
Product	histidine ammonia-lyase
Protein accession	YP_003200811
Protein GI	258651655
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.466068
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGAGCC CTCTGCAGAT CGGAACCCAG CCCCTGACCC AGGCCGACGT GGTCGCGGTC 
GTGCGGCACG CCCGCCCGGT CGTCCTCGGC CCCGACGCGC TGGCCGCGAT GGCCGCCAGC 
CGGGCCGTCG TGGACACCCT GGCCGGCGAC GCGCACCCGC ACTACGGCAT CTCCACCGGG 
TTCGGTGCCC TAGCCACGAC GTCCATCCCG CCGTCCCGGC GGACGGCGCT GCAGCAGTCG 
CTGATCCGGT CGCACGCCGC CGGCAGCGGT GAGCCGGTCG AGCGGGAGGT GGTCCGCGGC 
CTGATGCTGC TGCGGCTGGC CACCCTGGCC CGCGGTCGCA CCGGTGTCCG GCCGGCCACT 
GCCGCCCTGC TGGCCGCCAC CCTGTCCGCG GGGATCACCC CGGTCGTCCC CGAATACGGT 
TCGCTGGGGT GCTCGGGCGA CCTGGCCCCG CTGGCCGCCG TCGCCCTGAC CCTGATCGGC 
GAAGGGGAGG TGCACGACGC GCGGGGTCGG CGCCGCCCGG CGGCCGATGC GCTGGCCGAG 
GCCGGTCTGA CCCCGGTGAC GTTGGCCGAG AAGGAGGGCC TGGCCCTGAT CAACGGCACC 
GACGGCATGC TGGGCATGCT GGTGCTGGCC CTGCACGACC TGGCCGGTCT GCTGGACGCG 
GCCGACCTGG CCGCCGCGAT GTCGGTGGAA GCCCTGCTGG GCACCGACCG GGTGTTCGCC 
GCAGACCTGC AGCGGTTGCG CCCGCAGGCC GGACAGGCGG TCAGTGCGGC CCGGATCGCG 
GCCGCGCTGG CCGGCTCGCC GATCGTTGCC TCGCACGCCG GGCCCGAGGA CACCCGGGTG 
CAGGACGCCT ACTCGCTGCG CTGTGCCCCG GCCGTGCACG GCACCGCGCG GGACACGGCG 
GGGTACGCCG CCGCCGTCGC CGATCGGGAG CTGGCCTCCT CCATCGACAA CCCGGTCGTG 
CTGCCGGACG GACGGGTCGA GTCCAACGGC AACTTCCACG GCGCCCCGAT CGCGGCCGTG 
CTGGACTTCC TGGCCATCTC GGTGGCCGAC GTGGCCAGCA TCTGCGAGCG GCGGACGGAC 
CGGATGCTCG ACCGCACCCG GTCGCACGGG CTGCCGCCGT TCCTGGCCCA CGAGGTCGGC 
GTGGACTCCG GGCTGATGAT CGCCCAGTAC ACCCAGGCCG GCATCGTCAG CGAGCTCAAG 
CGGCTGGCCG TCCCGGCCTC GGTCGACTCG ATCCCCTCGT CGGCCATGCA GGAGGACCAC 
GTTTCCATGG GCTGGCACGC GGCCCGCAAG CTGCGCCGCG CGGTGGACGG GCTGCGCCAG 
GTCATCGCCA TCGAGATGCT CGCCGCGGCA AGAGCTCTGG ACCTGCGCGC GCCGCTGGCC 
GCGGGCCCGG TGACCGGCGC GATGCGCGAG GTCATCCGGA CGGCGGTGCC CGGCCCGGGG 
CCGGATCGTC ATCTGGCGCC GGAGATCGAG GCCGTGGTAG CACTGTTGGC GTCGGGAGCC 
ATCCTCGCCG CCGGGTCGCC GGCCGCACCC GGCCCGGTCC GATGA

Protein sequence

MTSPLQIGTQ PLTQADVVAV VRHARPVVLG PDALAAMAAS RAVVDTLAGD AHPHYGISTG 
FGALATTSIP PSRRTALQQS LIRSHAAGSG EPVEREVVRG LMLLRLATLA RGRTGVRPAT 
AALLAATLSA GITPVVPEYG SLGCSGDLAP LAAVALTLIG EGEVHDARGR RRPAADALAE 
AGLTPVTLAE KEGLALINGT DGMLGMLVLA LHDLAGLLDA ADLAAAMSVE ALLGTDRVFA 
ADLQRLRPQA GQAVSAARIA AALAGSPIVA SHAGPEDTRV QDAYSLRCAP AVHGTARDTA 
GYAAAVADRE LASSIDNPVV LPDGRVESNG NFHGAPIAAV LDFLAISVAD VASICERRTD 
RMLDRTRSHG LPPFLAHEVG VDSGLMIAQY TQAGIVSELK RLAVPASVDS IPSSAMQEDH 
VSMGWHAARK LRRAVDGLRQ VIAIEMLAAA RALDLRAPLA AGPVTGAMRE VIRTAVPGPG 
PDRHLAPEIE AVVALLASGA ILAAGSPAAP GPVR