Gene Ndas_1451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1451
Symbol
ID	9245301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1775643
End bp	1776857
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	74%
IMG OID
Product	DegT/DnrJ/EryC1/StrS aminotransferase
Protein accession	YP_003679389
Protein GI	297560415
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.362156
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0812638
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAGAAGT TGAAGAGAAC GCTCGAACCC CCCGAGGCGG CGCCCCCCGG CAGAACACGC 
CTCCCCGTCC CCTTCTTCGA CCAGTCCCGG AGCTTCGCGG AACTGTGGCC GCGCATCCGG 
GACAACTGCC TGCGGGTCAT GGACCGGGGC AAGTTCTCGC ACGGGGCCAT GGTCGCCGAG 
TTCGAGGACG CCCTGGCCCG CTGGACCGGC GCCCGGCACG TGGTCGGCGT CAACTCCGGA 
ACCGACGCCC TCGTCATCCT GCTGCGCGCC GCCGGGCTGC GCCCCGGCGA CGAGGTGATC 
GTCCCCGCCT ACTCCTTCGT CGCCACCGCC AGCTCCGTCG TCCTCGCCGG AGGCGTCCCG 
GTCTTCGCCG ACATCGAGGA GCACGGGTAC GGCATCGACC CGGCCTCGGT GGACGCGGTG 
GCCACCTCCC GCACCCGGAT GGTCATGCCG GTCCACCTGT TCGACCGCCT GGCCGACATG 
GAGGGCGTGC GCGAGGTCGC CCGGCGCCGC GGCCTGACCG TGCTGGAGGA CAGCGCCGAG 
GCCATCGGCA TGCGGCTGCG CGGCGTGCAC GCCGGGCTGC TGGGCACCGG CGGCGTGCTG 
TCCTTCTTCC CCTCCAAGAC CCTCGGCGCC ATCGGCGACG CGGGCGCGCT GCTCACCGAC 
GACGACGCCG TCGCCGAGAC CGCGCGGGCG CTGCGCCACC ACGGCCGCTC CGGACGCACC 
CTGGACGACT TCCCCGGCAT CGCCAACCCG ACGGTCGTCG CGGGCTGCAA CAGCAAGATG 
GACGACCTCC AGGCCGCCGT GCTGCTGGCC AAGCTCTCCC GCCTCGACGC CGACATCGCC 
CGCCGCGCCG AGCTGTCCGC GCGCTACGAC GCCCGCCTGC GCGACCTGCC CGGGATACGC 
GCCGTGCCCG GCGCCGTTCC GCCCCACCCC GGCGGCAACC GGGTCGTCTA CGTCCACCTG 
GTCGAGGCCG ACGACCGCGA CGCCCTGGTC GCCCACCTGG CCGAGGCCGG GATCGGCACC 
GAGACCTACT ACCCGATCCC GCTGCACCTG CAACCCTGCT TCACCCACCT GGGACACGCG 
CCCGGCGACT TCCCGCGCGC CGAGGCGGCC TGCGAGGGGG CGGTGGCCCT ACCGCTCTAC 
CCCGACCTGA CCGACGCCCA GGCGGACCGG GTCTGCGAGG AGATCGAGGA CTTCTGCCTT 
CGGAGGCACG GATGA

Protein sequence

MEKLKRTLEP PEAAPPGRTR LPVPFFDQSR SFAELWPRIR DNCLRVMDRG KFSHGAMVAE 
FEDALARWTG ARHVVGVNSG TDALVILLRA AGLRPGDEVI VPAYSFVATA SSVVLAGGVP 
VFADIEEHGY GIDPASVDAV ATSRTRMVMP VHLFDRLADM EGVREVARRR GLTVLEDSAE 
AIGMRLRGVH AGLLGTGGVL SFFPSKTLGA IGDAGALLTD DDAVAETARA LRHHGRSGRT 
LDDFPGIANP TVVAGCNSKM DDLQAAVLLA KLSRLDADIA RRAELSARYD ARLRDLPGIR 
AVPGAVPPHP GGNRVVYVHL VEADDRDALV AHLAEAGIGT ETYYPIPLHL QPCFTHLGHA 
PGDFPRAEAA CEGAVALPLY PDLTDAQADR VCEEIEDFCL RRHG