Gene Ndas_3902 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3902
Symbol
ID	9247773
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4674540
End bp	4675646
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	77%
IMG OID
Product	succinyldiaminopimelate transaminase
Protein accession	YP_003681805
Protein GI	297562831
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.116371
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGAGC GGCGACCCGT GGCGAAGCGG CTCCCGACCT TCCCGTGGGA CCGGCTGGCG 
CCGTACAAGC GCAGGGCCGC CGAGCACCCC GGCGGCATCG TCGACCTGTC CGTCGGCACC 
CCCGTGGACC CGGTGCCCGC CCTGCTGCGC AAGGCCCTCG CCGACGCCGC CGACGCGCCC 
GGCTACCCCC AGACCTGGGG CACGCCCGCG CTGCGCGCCT CCGTCGCGGG CTGGCTGGAG 
CGCCGCCACG GCGTGCGCGT GGCGGAGGGC GCCGTCCTGC CCACCGTGGG CTCCAAGGAG 
CTCGTGGCCT GGCTGCCCAC GCTCCTGGGC CTCGGCGCGG GCGACACGGT CGTCCACCCC 
GAGCTGGCCT ACCCCACCTA CGACATCGGC GCGCGCGTGG CCGGGGCCAC CCCGGTGGCC 
TCCGACGGCC TCACCTCCCT CGGCCCCGCC CCCGTCGGAC TGGTGTGGGT GAACTCGCCG 
AGCAACCCGA CCGGCCGGGT CCTGGGCACC GCGCACCTGC GCAAGGTGGT GGAGTGGGCC 
CGCGAGCGCG GCGCGATCGT GGCCTCCGAC GAGTGCTACC TCGACCTGGG CTGGGACGGC 
GCCGAACCGG TGTCCATCCT GCACCCGGAC GTGTGCGGCG GATCCCACGA CAACCTGCTG 
GCCGTGCACT CGCTGTCCAA GCGCTCCAAC CTGGCCGGGT ACCGCGCGGC CTTCGTCACC 
GGGGACCCCG CGCTGGTCGA GGAGCTGCTG GCGGTGCGCA AGCACGCCGG GATGATCGTC 
CCCGCGCCCG TCCAGGCGGC CATGGGCGCC GCCCTGGACG ACGACGCGCA CGCCACCGAG 
CAGAAGGAGC GCTACCGGTC CCGCCGTGCC AGGCTGCGCG AGGCCCTGGA GGGCGCGGGC 
TGGCGCATCG AGCACTCCGA CGCCGGGCTG TACCTGTGGG CCAGCCACCC CGACCACGAC 
GCCTGGGGCG CGGTGGCCCA CCTGGCCGAA CGCGGCGTGC TGGTCGCTCC CGGGGACTTC 
TACGGCCCGG CGGGCGCCGG GCACGTGCGC GTGGCGTTCA CCGCCACCGA CGAGCGGGTC 
GAGGCCGCGG CCGAGCGCCT GGCCTGA

Protein sequence

MAERRPVAKR LPTFPWDRLA PYKRRAAEHP GGIVDLSVGT PVDPVPALLR KALADAADAP 
GYPQTWGTPA LRASVAGWLE RRHGVRVAEG AVLPTVGSKE LVAWLPTLLG LGAGDTVVHP 
ELAYPTYDIG ARVAGATPVA SDGLTSLGPA PVGLVWVNSP SNPTGRVLGT AHLRKVVEWA 
RERGAIVASD ECYLDLGWDG AEPVSILHPD VCGGSHDNLL AVHSLSKRSN LAGYRAAFVT 
GDPALVEELL AVRKHAGMIV PAPVQAAMGA ALDDDAHATE QKERYRSRRA RLREALEGAG 
WRIEHSDAGL YLWASHPDHD AWGAVAHLAE RGVLVAPGDF YGPAGAGHVR VAFTATDERV 
EAAAERLA