Gene Tpau_4075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_4075
Symbol
ID	9158262
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	+
Start bp	4201255
End bp	4202346
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	69%
IMG OID
Product	histidinol-phosphate aminotransferase
Protein accession	YP_003648984
Protein GI	296141741
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCCTCCG CGAACGAACC CCAGCCCGGA CCGCTCGGCA TCCGCGCCGA CCTCGACACG 
CTGCCGGCGT ACGTGCCGGG CAAGGCGCTG CCGTCGGCGA TCAAACTCTC GTCCAACGAG 
GTGGTCGAGG GTCCGCTGCC CTCCGTGGCC ACCGCCCTCG CGGAGGCGCT GGCGAGCGCC 
AACCGATACC CGGACAACGG CGCCGTTGCT CTGCGCGCAG AGCTGGCGAA GCTGACGGGC 
GCGACCGAAG AGCAGTTGCA CGTGGGCTGC GGATCCGTGG CGCTGTGCCA GGACCTGGTA 
CAGGTCACCT GCCGGCCCGG CGACGAGGTG ATCTTCGCGT GGCGCAGCTT CGAGGCCTAC 
CCGATCATCA CCCGGGTGGT GGGTGCGGTT CCGATGCAGG TGCCGCTCAC CCCGGATGCG 
GTGCACGATC TGGACGCGAT GGCGGCGGCG ATCACCGATC GCACGCGCCT GATCTTCGTC 
TGCAACCCGA ACAACCCCAC CGGCACGACG GTCTCCGAAC AGCAGCTCGA GGAGTTCCTC 
GCGGCGGTGC CGCCGCACGT GATCGTCGCC CTTGATGAGG CGTACTACGA GTACCACCGC 
GGCAACGAGC AGTCGGGCGA GCGGATCGAC GGCACGGCGG TGGCGGCGCG GCATCGCAAT 
GTGATCGCAC TGCGCACCTT CTCCAAGGCG TACGGACTCG CGGGCCTGCG GGTGGGTTAC 
GCGATCGGCG ATCCCGAGCT CATCGGCGCT TTGACCAAGG TGCATCTGCC GTTCTCGGTC 
AGCGTGGCCG CGCAGGCCGC CGCGATCGCG TCGCTGCGCG CGAACGACGA GCTGCTGGCC 
CGCACGGAGG CAGTGGTCAC CGAGCGGATC CGAGTACGGG ACGCACTGCG GAAGAACGGA 
TTCGAGGTGC CGCACACCCA GGCCAATTTC GTGTGGCTGC CCCTCGGCGA GGATGCGGCC 
CGATTCACCG CCGATGCCGC CGAGGCCGGA ATCCTGGTGC GCGGCTTCGC GGGCGACGGT 
GTGCGGGTCA CCGTGACCAC ACCGGAGGAG AACGACGCTT TCCTCTCCTT CGCGAAGGAG 
TGGTCGAAAT GA

Protein sequence

MASANEPQPG PLGIRADLDT LPAYVPGKAL PSAIKLSSNE VVEGPLPSVA TALAEALASA 
NRYPDNGAVA LRAELAKLTG ATEEQLHVGC GSVALCQDLV QVTCRPGDEV IFAWRSFEAY 
PIITRVVGAV PMQVPLTPDA VHDLDAMAAA ITDRTRLIFV CNPNNPTGTT VSEQQLEEFL 
AAVPPHVIVA LDEAYYEYHR GNEQSGERID GTAVAARHRN VIALRTFSKA YGLAGLRVGY 
AIGDPELIGA LTKVHLPFSV SVAAQAAAIA SLRANDELLA RTEAVVTERI RVRDALRKNG 
FEVPHTQANF VWLPLGEDAA RFTADAAEAG ILVRGFAGDG VRVTVTTPEE NDAFLSFAKE 
WSK