Gene Namu_2096 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2096
Symbol
ID	8447707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	2313952
End bp	2315064
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	73%
IMG OID	645041219
Product	threonine synthase
Protein accession	YP_003201463
Protein GI	258652307
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00000119841
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0436227
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGCAC CCGTGTCGGA CGCGAGCGTG ACCGGGATCG CCGGCGGGGC CGGGGCCGGG 
TGGCCGGGGC TGATCGCCGC CTACGCCGAC CGGGTCGCCG TGCCGCCCGG GGCCCGGGTG 
GTCACGTTGC TGGAGGGCGG CACGCCGCTG CTGCCGGCGC ACACCCTGTC CGACCGGCTG 
GGCGTGCAGG TCTACCTCAA GGTCGAGGGG GCCAACCCGA CCGGCTCGTT CAAGGACCGG 
GGGATGACGG TCGCGGTCAC CCACGCGCTG GCCCGCGGTG CCCGCGCGGT GATCTGCGCC 
TCCACCGGCA ACACCTCGGC CTCGGCGGCC GCCTATGCGG CCCGGGCCGG ACTGACCAGC 
GCGGTGCTGA TCCCGCAGGG CAAGATCGCC AGCGGCAAGC TGGCCCAGGC CGTGGCCTAC 
GGGGCCCGGA TCCTGCAGGT CGAGGGCAAC TTCGACGACT GCCTGGAGCT GGCCCGCAAG 
ACCGCGGCCA CCACCGACGA GATCGAGCTG GTGAACTCGG TCAACCCGGT GCGGATCGAA 
GGGCAGAAGA CCGCCGCGTT CGAGATCTGC GACGTGCTGG GCCGGGCCCC GGACGTGCAC 
TTCCTGCCGG TCGGCAACGC GGGCAACATC ACCGCGTACT GGAAGGGGTA CCGCGAGTAC 
CACGCGGACG GCGTCATCGA CGCTCTGCCC CGGATGTTCG GCTTCCAGGC CGCCGGCGCC 
GCGCCGCTGG TGCTGGGCCA TCCGGTGCGC GACCCGGACA CCATCGCGAC CGCGATCCGG 
ATCGGCGCCC CGGCGTCTTG GAGCGGGGCG ATCGGCGCCC GGGACGAGTC CGGCGGTCTG 
ATCGACATGG TCACCGACGA CCAGATCCTG GACGCCTACC GGCTGCTCGC CTCGACCGAG 
GGCGTCTTCG TCGAGCCCGC GTCGGCCGCG TCGGTGGCCG GGCTGACCGC CACCGTCGCC 
GACGGCCGGT TGCCGGCCGG GTCGCTGGTG GTCTGCACCG TCACCGGCAA CGGGCTCAAG 
GACCCGGACA CCGCGATGTC GTTCATGACC GAACCGGTCG TCCTGCCGGT CGCGGCCGAG 
GCGGTCACCG ACGCCCTGGG GCTCACCGGA TGA

Protein sequence

MDAPVSDASV TGIAGGAGAG WPGLIAAYAD RVAVPPGARV VTLLEGGTPL LPAHTLSDRL 
GVQVYLKVEG ANPTGSFKDR GMTVAVTHAL ARGARAVICA STGNTSASAA AYAARAGLTS 
AVLIPQGKIA SGKLAQAVAY GARILQVEGN FDDCLELARK TAATTDEIEL VNSVNPVRIE 
GQKTAAFEIC DVLGRAPDVH FLPVGNAGNI TAYWKGYREY HADGVIDALP RMFGFQAAGA 
APLVLGHPVR DPDTIATAIR IGAPASWSGA IGARDESGGL IDMVTDDQIL DAYRLLASTE 
GVFVEPASAA SVAGLTATVA DGRLPAGSLV VCTVTGNGLK DPDTAMSFMT EPVVLPVAAE 
AVTDALGLTG