Gene Ndas_3669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3669
Symbol
ID	9247538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4404795
End bp	4406126
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	71%
IMG OID
Product	aminotransferase class-III
Protein accession	YP_003681573
Protein GI	297562599
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.445293
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGTCC TGGCCAAGTC CGGTGCTCGG GGCGAGACTG GGGGCATGTC GGAACTTCTC 
TCACGCCACC GCGCGGTCAT GCCCTCCTGG CTTCCCCTGT ACTACGAGTC CCCGCTGGAG 
ATCACCGGCG GCAAGGGCGC CCGTGTCACG GACGCCGACG GAAACACCTA CCTGGACTTC 
TTCACCGGCA TCGTGACCAA CATGCTCGGC TACGACGTGG CGGAGGTGCG CGAGGCCGTC 
GAGCGCCAGA TCGCCAGGGG GGTCGTGCAC ACCTCCACCC TCTACCTCAT CCGCAGCCAG 
GTGGAGCTGG CGGAGAAGAT CGCCCGCCTG TCGGGCATCC CGGACGCGAA GGTGTTCTTC 
ACCAACTCCG GCACCGAGGC CAACGAGACC GCCCTGCTGC TGGCCACGTA CGCGCGCGGC 
AGCGACGAGG TGCTGGCGAT GCGCGGCAGC TACCACGGGC GCTCGTTCGG CACGGTGGCC 
GTGACCGGCA ACCGGGCGTG GAAGAACTCC TCCCTGTCGC CGCTGAACGT GCACTACCTG 
CACGGCACCG ACCACGCGGC CCCGGCCTTC CGGGGGATGA CCGACCGGGA GTACGTCGAT 
GCGTGCGTGG CCGACCTGCG CGACGTGCTG GACACCACGG CGCCGAACGT GGCGTGCCTG 
ATCGCCGAGC CCGTGCAGGG TGTGGGCGGG TTCGCGATGC CTCCGGACGG CCTGTACGCC 
GCCTACAAGG AGGTGCTGGA CGAGCACGGC ATCCTGTTCG TGTCCGACGA GGTGCAGACC 
GGCTGGGGGC GCACGGGCAC GAGCTTCTTC GGCATCGGCA ACCACGGGGT GGTCCCGGAC 
GCCATGACCT TCGCCAAGGG CCTGGGCAAC GGGTTCGCCG TGGGCGGTGT GGTGGCGCGC 
GGCGACCTGA TGGACCGGCT GGGCGCGCTG GGCGTGGCCA CGTTCGGCGG CAACCCGGTG 
TCGATGGCGG CGGCGGGGGC GACCCTGGAC TACGTGTTGG AGCACGACCT CCAGGGCAAC 
GCGCGGCGGC AGGGCGCGCT GATCCTGGAG GGGCTCAGCG CGCTGACCTC GCTGCCGAGC 
GTGCGCGACG TGCGCGGCAA GGGGCTGATG TTCGCCGTGG AGATGATGGA CCCCGCCACC 
GGAGCGCCGT CCTCACCCCT GGCCGGGCGG GTGCTGGAGG CCACCCGTGA GCGCGGCCTG 
CTGGTGGGCA AGGGCGGCGT GCACGGCAAC GTGCTGCGGA TGGCGCCGCC GATGACGCTG 
TCGCGGGAGG AGGCCGTGGA GGGCCGCGAC GTGCTGCTGG ACGCGGTGCG CACGGTGGAC 
GCCGGGGCCT GA

Protein sequence

MLVLAKSGAR GETGGMSELL SRHRAVMPSW LPLYYESPLE ITGGKGARVT DADGNTYLDF 
FTGIVTNMLG YDVAEVREAV ERQIARGVVH TSTLYLIRSQ VELAEKIARL SGIPDAKVFF 
TNSGTEANET ALLLATYARG SDEVLAMRGS YHGRSFGTVA VTGNRAWKNS SLSPLNVHYL 
HGTDHAAPAF RGMTDREYVD ACVADLRDVL DTTAPNVACL IAEPVQGVGG FAMPPDGLYA 
AYKEVLDEHG ILFVSDEVQT GWGRTGTSFF GIGNHGVVPD AMTFAKGLGN GFAVGGVVAR 
GDLMDRLGAL GVATFGGNPV SMAAAGATLD YVLEHDLQGN ARRQGALILE GLSALTSLPS 
VRDVRGKGLM FAVEMMDPAT GAPSSPLAGR VLEATRERGL LVGKGGVHGN VLRMAPPMTL 
SREEAVEGRD VLLDAVRTVD AGA