Gene Ndas_3191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3191
Symbol
ID	9247048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3815231
End bp	3816313
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	74%
IMG OID
Product	histidinol-phosphate aminotransferase
Protein accession	YP_003681105
Protein GI	297562131
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.253345
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCTTCA CCCTGAACGA CCTGCCCCTG CGCGACGACC TGCGCGGCCG CTCGCCCTAC 
GGCGCGCCGC AGCTGGACGT GCCCGTGGTG CTCAACACCA ACGAGAACCC GCACCCGCCC 
TCGGCGCGCC TGGCCAAGGC GCTGGCCGAG GCGGTCGCCG ACACCGCCCT GGGCCTCAAC 
CGCTACCCCG ACCGGGACGC GGTCCGCCTG CGCGAGGGCC TGGCCGCCTA TCTCGGCCAC 
GGCCTGACCG CCGACCAGGT GTGGGCGGCC AACGGCTCCA ACGAGGTCCT CCAGCAGATC 
CTCCAGGCCT TCGGCGGCCC CGGCCGGTCC GCCATGGGCT TCGAGCCGTC CTACTCCATG 
CACCCGATCA TCTCCCGGGG CACCGGCACC GCCTGGGTGT CCGTGCCGCG CGGAGCCGAC 
TTCCGCGTCG ACGTGGACGC CGCCCTGGCC GCCATCGCCG AGCACCAGCC CAGCGTCGTC 
TTCCTCACCT CGCCCAACAA CCCCACCGGC ACCGCCCTGG ACCTGGCCGA CACGGAGCGC 
GTCCTGGCCG CGGCCCCCGG CGTCGTGGTC GTGGACGAGG CCTACGCCGA GTTCCGCCGC 
GAGGGCACGC CCAGCGCGCT GAGCCTGCTG TCCGACCACC CCAGGCTCGT CGTCTCGCGC 
ACCATGTCCA AGGCCTTCGC CCTGGCCGGG GCGCGCGTGG GCTACCTGGC CGCCCACCCG 
GCCGTGGTCG AGGCCCTCCA GCTGGTCCGC CTGCCCTACC ACCTGTCCGC CGTCACCCAG 
ACGGTCGCGC TCACCGCGCT CGACCACGCC GACGAACTCC TCGCCGCCGT CGCCGACCTG 
CGCGCCGAAC GCGACTCCCT GGTCTCCTGG CTGCGCGGGC ACGGCTTCTC GGTCGCCGAG 
TCCGACGCCA ACTTCGTCCT GTTCGGCGAG TTCGAGGACC GCAGCCGCGT CTGGCAGGAC 
ATGCTCGACC AGCAGGTCCT CATCCGCGAG ACCGGCCCGC CCGGGTGGCT GCGCGTCAGC 
GTCGGAACCC CGCAGGAGAT GGCCGCCTTC CGCCGGGCCC TGCTCAGCGC CACCGGACGC 
TGA

Protein sequence

MSFTLNDLPL RDDLRGRSPY GAPQLDVPVV LNTNENPHPP SARLAKALAE AVADTALGLN 
RYPDRDAVRL REGLAAYLGH GLTADQVWAA NGSNEVLQQI LQAFGGPGRS AMGFEPSYSM 
HPIISRGTGT AWVSVPRGAD FRVDVDAALA AIAEHQPSVV FLTSPNNPTG TALDLADTER 
VLAAAPGVVV VDEAYAEFRR EGTPSALSLL SDHPRLVVSR TMSKAFALAG ARVGYLAAHP 
AVVEALQLVR LPYHLSAVTQ TVALTALDHA DELLAAVADL RAERDSLVSW LRGHGFSVAE 
SDANFVLFGE FEDRSRVWQD MLDQQVLIRE TGPPGWLRVS VGTPQEMAAF RRALLSATGR