Gene Ndas_0176 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0176
Symbol
ID	9244007
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	224648
End bp	225763
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	70%
IMG OID
Product	branched-chain amino acid aminotransferase
Protein accession	YP_003678132
Protein GI	297559158
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.473738
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAACG ACACCACCAC AAGCGGGTTG ACGTTCGACA TCCAGCTCTC CGACAGGCGG 
AAGACCCCGC AGGAACGAGA GGCGCTGCTG GAGAGTCCCG GGTTCGGCAA GGTGTTCACC 
GACCACATGG TGAGCATCCA CTACACCGAG GGGAAGGGGT GGCACGACGC TAAGCTGGAG 
CCGTACGGCC CGCTGAGCCT GGACCCGGCC ACCGCCGCCC TCCACTACGC CCAGGAGATC 
TTCGAGGGCC TCAAGGCCTA CCGGCACCCC GACGGCTCGC TCGCCTCCTT CCGCCCCGAG 
TCCAACGCGG CCCGCTTCAA CCGCAGCGCG GCGCGCATGG CGATGCCCGA GCTCCCCGAG 
GAGCTCTTCC TGAAGTCCAT CGAACTCCTC CTGGAGCACG ACGGCGACTG GGTGCCGACC 
AAGGAGGACT TCAGCCTGTA CCTGCGCCCG TTCATGGTCG CCACCGACGT CGGCCTGGGC 
GTCAACCACC CGTCCCGCTC CTACGTCTAC CTGCTGATCG CCTCGCCGGT CGGCTCCTAC 
TTCTCGGGCG GCGTCCAGCC GGTGACGGTG TGGCTGTCCA GGGACTACAC GCGCGCCGCG 
CCGGGCGGCA CGGGCGCGGC CAAGTTCGCG GGCAACTACG CGGCGAGCTT CCTCGCCCAG 
GCGCAGGCGG TGGAGCAGGG CTGCGACCAG GTGGTCTGGC TCGACGCCCG CGAGCACCGC 
TGGGTCGAGG AGATGGGCGG CATGAACCTG TGGTTCGTGT TCGGCTCGGG TGAGAACGCG 
CGTCTGCGCA CGCCCCCGCT GACCGGGACC CTGCTGCCGG GCATCACCCG CGAGTCGCTG 
CTGACCCTGG CCCCCGACCT CGGCATCCCG GCCGAGGAGG CGCCCATCTC CACCGACGAG 
TGGCGTGAGG CGGCCGAGTC CGGCGAGCTC ACCGAGGTGT TCGCCTGCGG CACCGCGGCC 
GTCATCACCC CCGTCGGCCG GGTCAAGGGC GACGACGGCG AGTTCACCGT CGGCGACGGC 
ACCCCGGGCC CGGTCACCAT GCGCCTGCGC GAGGAGCTGG TGGGCATCCA GACGGGTCTG 
CGCGCCGACA AGCACGACTG GATCACCCGG TTCTGA

Protein sequence

MNNDTTTSGL TFDIQLSDRR KTPQEREALL ESPGFGKVFT DHMVSIHYTE GKGWHDAKLE 
PYGPLSLDPA TAALHYAQEI FEGLKAYRHP DGSLASFRPE SNAARFNRSA ARMAMPELPE 
ELFLKSIELL LEHDGDWVPT KEDFSLYLRP FMVATDVGLG VNHPSRSYVY LLIASPVGSY 
FSGGVQPVTV WLSRDYTRAA PGGTGAAKFA GNYAASFLAQ AQAVEQGCDQ VVWLDAREHR 
WVEEMGGMNL WFVFGSGENA RLRTPPLTGT LLPGITRESL LTLAPDLGIP AEEAPISTDE 
WREAAESGEL TEVFACGTAA VITPVGRVKG DDGEFTVGDG TPGPVTMRLR EELVGIQTGL 
RADKHDWITR F