Gene Namu_0303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_0303
Symbol
ID	8445884
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	335160
End bp	336230
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	74%
IMG OID	645039448
Product	histidinol-phosphate aminotransferase
Protein accession	YP_003199722
Protein GI	258650566
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGTGC GGATCCGATC GGCGTTGGAC ACCCTGCCCG CCTACGCCCC GGGCCGCTCG 
GTGCCCGGCG CGATCAAGCT GGCCTCCAAC GAGCTGGCCT TCCCCACCCT GCCGGCCGTC 
GCCCAGGCCA TCGCCGACGC CGCGGTGCAC GAATCGAGCG GCATCAACCG GTACCCGGAC 
AACGGCGCGG CCCGGCTGGT GACCGCGCTG GCCGCGCTGA CCGGCGCCCC GGAGTCGCAC 
ATCGTGACCG GCTGCGGGTC GGTGGCCCTG TGCCAGCAAC TGGTCCAGGC CACCGCGGAG 
GCCGGCGACG AGGTGCTGTT CGGCTGGCGC TCGTTCGAGG CCTATCCGAT CGTCACCCAG 
ATCACCGGGG CCACCGCGGT CCGGGTGCCG GTCACCGCCG GCCACGAGCT GGACCTGGCG 
GCGATGGCCG ACGCGATCAC CCCGGCCACC CGGCTGATCT TCATCTGCAC CCCGAACAAC 
CCGACCGGCA CCACCGTCCG CGCCGCCGAC CTGATCGCCT TCCTGGATCG GGTGCCCGAG 
CACGTCCTGG TCACCATCGA CGAGGCCTAC ACCGAGTTCG ACGACGCCGA CGACTCCCCC 
GACGGCCTGG CCGAGGCGAC CAGCCGGCCC AACGTGGTCA CCCTGCGCAC CCTGTCCAAG 
GCCTACGGCC TGGCCGGGCT GCGCGTCGGC TACGCGGTGG CCGACCCGGC CGTCGTCACC 
GCCCTGCGCA AGGTGGCCAT CCCGTTCGCG CTGAACTCGC TGGCCCAGGC GGCGGCGTTG 
GCCGCCCTCG GTGCCCGCGC CGAGCTGGCC CCGCGGTGGC AGCAGGTCGT CGCCGAACGC 
ACCCGGGTGC ACGCGGCGCT GCGCGAGCTG GGCTACGAGG TCCCGGTGTC CCGGGCCAAC 
TTCGTCTGGC TGCCGCTGCG GGAGCGCTCG GCTGAGTTCG CCGCGCACAG CGAGCAGCAC 
AAGGTCATCG TCCGGGCCTT TGCGGACGCC TCCGGTGGAG TCCGGGTGTC CATCGGCGCC 
CCGCACGAGA ACGACGCCTT CCTGGCGGCG GCCGCCGCCT TCCCCCGCTG A

Protein sequence

MTVRIRSALD TLPAYAPGRS VPGAIKLASN ELAFPTLPAV AQAIADAAVH ESSGINRYPD 
NGAARLVTAL AALTGAPESH IVTGCGSVAL CQQLVQATAE AGDEVLFGWR SFEAYPIVTQ 
ITGATAVRVP VTAGHELDLA AMADAITPAT RLIFICTPNN PTGTTVRAAD LIAFLDRVPE 
HVLVTIDEAY TEFDDADDSP DGLAEATSRP NVVTLRTLSK AYGLAGLRVG YAVADPAVVT 
ALRKVAIPFA LNSLAQAAAL AALGARAELA PRWQQVVAER TRVHAALREL GYEVPVSRAN 
FVWLPLRERS AEFAAHSEQH KVIVRAFADA SGGVRVSIGA PHENDAFLAA AAAFPR