Gene Ndas_1175 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1175
Symbol
ID	9245025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1431003
End bp	1432112
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	77%
IMG OID
Product	Prephenate dehydrogenase
Protein accession	YP_003679122
Protein GI	297560148
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.349516
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCCGCA CCATGGCGGT GGTCGGCACG GGACTCATCG GAACGTCCGT GGCGCTGGCC 
GCGGGACGGC ACGGGGTCGC CGTCCACCTG ATGGACCGGG ACCCCGCCGC GGCCCGCACC 
GCCGCCGCGC TGGGCGCCGG AACGGTCGGC GCCCCGGCCG AGGCGGTGGA CCTGGCCGTG 
ATCGCGGTGC CGCCCAGCAT GGTCGGCGCC GTCCTGGCCG AGCAGCAGCT GCGCGGCCTG 
GCCCGGGCCT ACACGGACGT GGCCAGCGTG AAGTCCGCGC CCGGCCGGGA CGTGCTGAGC 
GCCATCGCGG ACCCGGCGAC GTTCATCGGC GGCCACCCCC TGGCCGGCCG GGAGCGGGCG 
GGTCCCCTCG CGGCCCGCGC GGACCTGTTC GAGGGCCGCA CCTGGGTTCT CACACCGACG 
GCGGCCACCG CGCGACCAGT GCTCAACCGG GCGCTGGAGA TGATCTGCCT GTGCGGCGCG 
GTCCCGGTGA TGATGGACAG CCAGGCCCAC GACGACGCGG TGGCGCTGAC CTCGCACGCA 
CCGCACGTGG TGGCGAGCCT CATGGCGGCG CGGTTGCGCG GCGGGGCCGA GGAGGCCTTC 
CGCCTGGCCG GGCAGGGGTT GCGCGACACC ACCCGCGTCG CGGGCGGCGA CCCCCGGCTG 
TGGACCGACA TCCTGCGCGC CAACTCCGGG CCGCTGGTCG GGGTGCTGCG CGACCTGCAC 
GAGGACCTGT CACTGGTGCT GGCCTCCCTG GACGTGCTCT CCCGCTCCGG TCCGGGGCAG 
GGCGCGCGCG AGACGGGCCG GGTGCGCGAC CTGCTGGACC GGGGTTCCCA GGGCCTGGGA 
CTGCTCCGCG AGCAGCCGCC GGGCGGGGCG CGTCTGCGGG TGGCGGTGGA GGAGGCCCCC 
GGAGAGCTGG CACGGCTGCT GGCGGTGCTG GACGAGTCCG GCGTCACCGC CGACGACGTG 
TCCGCCTCCT GGGACCAGGA CACCCTGACG GCGGAGTTCG CGGCACCGGC CACCGCCGCC 
GGGCCGCTGC TGAGGCGGCT GGGGGCGGAG GGCTGGACGG CCGGGTACGC GGACCTGGCG 
ACGGACTCCG AGGTCGGCGC CCTGCGCTGA

Protein sequence

MIRTMAVVGT GLIGTSVALA AGRHGVAVHL MDRDPAAART AAALGAGTVG APAEAVDLAV 
IAVPPSMVGA VLAEQQLRGL ARAYTDVASV KSAPGRDVLS AIADPATFIG GHPLAGRERA 
GPLAARADLF EGRTWVLTPT AATARPVLNR ALEMICLCGA VPVMMDSQAH DDAVALTSHA 
PHVVASLMAA RLRGGAEEAF RLAGQGLRDT TRVAGGDPRL WTDILRANSG PLVGVLRDLH 
EDLSLVLASL DVLSRSGPGQ GARETGRVRD LLDRGSQGLG LLREQPPGGA RLRVAVEEAP 
GELARLLAVL DESGVTADDV SASWDQDTLT AEFAAPATAA GPLLRRLGAE GWTAGYADLA 
TDSEVGALR