Gene Ndas_4697 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4697
Symbol
ID	9248579
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5575567
End bp	5576889
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	70%
IMG OID
Product	DegT/DnrJ/EryC1/StrS aminotransferase
Protein accession	YP_003682589
Protein GI	297563615
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0177316
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.674112
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACGA GTGACGAGGC GGCGGCGGTT CTCGATGCGG TCCGTGAGCA CCACCGGTCC 
ACCCGCACCG AACGCGAGTT CGTTCCGGGT GTGACGGAGA TCTGGCCCTC CGGGGCGGTC 
CTGGACGAGG AGGACAGGGT GGCCCTGGTC GCGGCCGCCC TCGACATGCG CATCGCGGCG 
GGCCCCAGCG CACGCCGCTT CGAGTCCGCG TTCGCCCGCA GGCTCGGAAG GCGCAAGGCC 
CACCTCACGA ACTCCGGCTC CTCGGCCAAC CTGCTCGCGC TGTCCTCCCT GACCTCGCAC 
CTGCTGGAGG ACCAGCGGCT GCGCCCCGGC GACGAGGTCG TCACGGTCGC CGCCGGGTTC 
CCGACGACCG TCAACCCGAT CCTCCAGAAC GGGCTCGTGC CCGTGTTCGT GGACATCGAG 
CTGCGCACGT ACAACACCAC GGTCGAAAGG GTGGAACGGG CCATCGGCCC CCGTACCCGG 
GCGATCATGA TCGCCCACGC GCTGGGCAAC CCGTTCGAGG CGCGGGAGAT GGCGCGCCTG 
GCGGAGGAGC GCGACCTGTT CCTGATCGAG GACAACTGCG ACGCCGTGGG CTCCCTCTAC 
GACGGGCAGG TGACGGGCTC CTTCGGCGAC CTGTCGACGG TCAGCTTCTA CCCGGCGCAC 
CACCTCACCA TGGGCGAGGG CGGCTGCGTG CTCACGTCCA ACCTCATGCT GGCCCGTGTG 
GTGGAGTCCA TGCGCGACTG GGGGCGGGAC TGCTGGTGCG AGCCCGGTGA GAGCGACACC 
TGCCGCAAGC GCTTCAGCTA CCAGCTCGGG ACCCTGCCCC CCGGCTACGA CCACAAGTAC 
ACGTTCTCCC ACGTGGGCTA CAACCTGAAG GGGACCGACC TCCAGGCGGC GCTCGGGCTG 
AGCCAGCTCG ACAAGCTCGA CTCCTTCGGC GAGGCCCGGC GCCGCAACTG GCGCCGGATG 
CGGGAGGGGC TGGACGGGCT TCCGGGCCTG ATCCTGCCGG AGGCCACGCC CAACAGCGAT 
CCGAGCTGGT TCGGCTTCGT GGTCACCGTG GACCCCGGGG CGCCGTTCGA CCGGGCCGAG 
CTGGTCCACT TCCTGGAGTC CCGGCGGATC GGCACCCGCC TGCTCTTCGC GGGCAACCTG 
ACCCGGCACC CCGCCTACCT GGACCGGCCG CACCGCGTGT CCGGAGAGCT GGAGAACAGC 
GACATCGCCA CGGAGCGGAC CTTCTGGACC GGGGTCTACC CCGGGCTCAC GGACGAGATG 
ATCGACTACG TGGTCTCCTC GGTCACCGAG TTCGTCAAGG AGCGGCACAA GGGCGTCTTC 
TGA

Protein sequence

MATSDEAAAV LDAVREHHRS TRTEREFVPG VTEIWPSGAV LDEEDRVALV AAALDMRIAA 
GPSARRFESA FARRLGRRKA HLTNSGSSAN LLALSSLTSH LLEDQRLRPG DEVVTVAAGF 
PTTVNPILQN GLVPVFVDIE LRTYNTTVER VERAIGPRTR AIMIAHALGN PFEAREMARL 
AEERDLFLIE DNCDAVGSLY DGQVTGSFGD LSTVSFYPAH HLTMGEGGCV LTSNLMLARV 
VESMRDWGRD CWCEPGESDT CRKRFSYQLG TLPPGYDHKY TFSHVGYNLK GTDLQAALGL 
SQLDKLDSFG EARRRNWRRM REGLDGLPGL ILPEATPNSD PSWFGFVVTV DPGAPFDRAE 
LVHFLESRRI GTRLLFAGNL TRHPAYLDRP HRVSGELENS DIATERTFWT GVYPGLTDEM 
IDYVVSSVTE FVKERHKGVF