Gene Namu_4419 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4419
Symbol
ID	8450045
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4902721
End bp	4903932
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	72%
IMG OID	645043466
Product	threonine dehydratase
Protein accession	YP_003203695
Protein GI	258654539
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01127] threonine dehydratase, medium form

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACGGG TCGGCGTGGC GCAGGTCCGG GAGGCGGCGC AGGCCCTGGC CGGGATCATC 
CGGTACACCC CGATGGAGTC GTCCCGGCCG TTGCAGGAGG CGGTCGGCGG GCCGGTCCAT 
CTCAAGTGCG AGAACTTGCA GCGCACCGGC TCGTTCAAGA TCCGCGGCGC CTACCTGCGG 
ATATCGCGGC TCTCCACGGC GGAAAAGGCC GCCGGAGTGG TCGCCGCCTC GGCCGGCAAC 
CACGCCCAGG GGGTGGCCCT GGCCGCTGCC CTGATCGGCA CCCGGGCCAC TGTGTTCATG 
CCGGTGGGTG CCTCGATCGC CAAGTTGACC GCGACCCGGG CCTACGGTGC GCACGTCGAA 
CTGGTCGGGC AGACCCTGGA CGAGGCGCTG GAGGCGGCCC TGGCCTTCGC CGCGCGGACC 
GGCGCGGTGT TGGTGCACCC CTTCGACCAC CTAGATGTCT TGCTCGGCCA GGGCACCGTG 
GGGTTGGAGA TCGCCGAGCA GGTGCCGGAC GTGGCCACCG TGGTGGTCGC CGCCGGGGGC 
GGCGGGTTGA TCTCCGGGGT CGCCGCAGTG CTCAAGGAGC TCATCCCGTC CGTGCGAGTG 
GTCGGCGTGC AGGCCGAGCA GGCGGCGGCC TGGCCCGGTT CATTGGCCGC CGGGCGACCG 
GTCCGGCTGC GGGAGATGTC CACGCTGGCC GACGGCATCG CCGTGGGCAC GCCGTCGGAC 
CTGACGTTTG CGCACGTCAG TGACCTGGTC GACGAGATCG TGACGGTGAG CGAGGATCAG 
CTGTCGCAGG CCATGCTGCT GTGCCTGGAA CGGGCCAAGC TGGTGGTCGA GGCGGCCGGG 
GTGGCTGCCG TAGCGGCGAT CATGGCGCGC CCGCAGACGT TCGCCCCGCC CGTGGTGGCC 
GTGCTCTCCG GCGGGAACAT CGACCCGCTG GTGTTGCTGC ACGTCACCCA GCACGGCCTG 
GTCGCGGCCG GCCGGTTCCT GTCCCTACGG GTCGATATCG CCGACCGGCC CGGGTCCTTG 
GCCGCGCTGC TGGCCCTGGT GGGCGAGCTG GGCGGCAACG TCATCGACGT CGAGCATTCC 
CGGGTCGGTT CGTCGCTGAC CCTGGGCGAG GTGGAGGTGG CGCTAAGCAT GGAAACCCGG 
GGCGCCGAGC ACTGCGACGT GATCGTCGAG GCGCTCGGGC GCGCCGGGTT CCGGGTGCTG 
GACCGGCGCT GA

Protein sequence

MERVGVAQVR EAAQALAGII RYTPMESSRP LQEAVGGPVH LKCENLQRTG SFKIRGAYLR 
ISRLSTAEKA AGVVAASAGN HAQGVALAAA LIGTRATVFM PVGASIAKLT ATRAYGAHVE 
LVGQTLDEAL EAALAFAART GAVLVHPFDH LDVLLGQGTV GLEIAEQVPD VATVVVAAGG 
GGLISGVAAV LKELIPSVRV VGVQAEQAAA WPGSLAAGRP VRLREMSTLA DGIAVGTPSD 
LTFAHVSDLV DEIVTVSEDQ LSQAMLLCLE RAKLVVEAAG VAAVAAIMAR PQTFAPPVVA 
VLSGGNIDPL VLLHVTQHGL VAAGRFLSLR VDIADRPGSL AALLALVGEL GGNVIDVEHS 
RVGSSLTLGE VEVALSMETR GAEHCDVIVE ALGRAGFRVL DRR