Gene Ndas_4205 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4205
Symbol
ID	9248079
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5021142
End bp	5022401
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	71%
IMG OID
Product	threonine synthase
Protein accession	YP_003682103
Protein GI	297563129
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGATTG CCGCCACCGA ACCCACCGCC GCCCGCTCCT TCGGCCCCGG CACCGCGCTC 
TCCTGTCGCG AGTGCGGCGA GCGCTACGAA CTCACCCCCC GGTTCGCCTG CGAGTTCTGC 
TTCGGCCCCC TTGAGGTCGC CTACGACTTC GGGACCGTCA CCCGCGCCGA CATCGAGAGC 
GGCCCCAAGA GCATCTGGCG CTACCGCTCC CTCCTGCCCG TCCCGGCCAA CGTCGCCGAG 
CTGCCCAACA TGGCCCCCGG CCTGACCCCG CTGGTGCGGG CCGACCGCCT CGCGGCCGAG 
CTGGGCCTGG ACTCCCTCCA CGTCAAGGAC GACTCCGGCA ACCCCACGCA CTCCTTCAAG 
GACCGCGTGG TCGCCATCGC CGTCGAGGCC GCCCGCACCT TCGGGTTCAC CACCCTGTCC 
TGCTCCTCCA CCGGCAACCT GGCCGGAGCC GTCGGCGCCG CCGCCGCGCG CGCCGGGTTC 
GAGTCCTGCG TGTTCATCCC CGCCGGGCTG GAGGAGGCCA AGGTCGTCAT GGCCTCCGTC 
TACGGCGGCA AGGTCGTGGC CATCGACGGC AACTACGACG ACGTCAACCG CTTCTGCTCC 
GAGCTCATCG GCGACCCGGT GGGCGAGGGC TGGGGCTTCG TCAACGTCAA CCTGCGCCCC 
TACTACGGCG AGGGCTCCAA GACGCTGGCC TACGAGATCG CCGAGCAGCT CGGCTGGCGC 
CTGCCCGAGC AGATCGTCGT CCCGATCGCG TCCGGCTCCC AGCTCACCAA GATCGACAAG 
GGCTTCCAGG AACTGGTCAA GCTCGGCCTG GTCGAGGACC GCCCGTACCG GATCTTCGGC 
GCCCAGGCCA CGGGCTGCTC CCCGGTCGCG CAGGCCTGGG ACAAGGGCAT CGACGTCATC 
CAGCCGGTCA AGCCCGACAC CATCGCCAAG TCGCTGGCCA TCGGCAACCC GGCCGACGGG 
CCCTACGTGC TGGACATCGC CAAGCGCACG GGCGGATCGG TGGAGCACGT GGGCGACGAC 
GAGATCGTCG ACTCCATCAA GCTCCTCGCC CGCACCGAGG GCATCTTCGC CGAGACCGCG 
GGCGGCGTCA CCACCGGCGT GCTGCGCAAG CTCGTCCGCG AGGGCAGGCT CGACCCGAAG 
GCCGAGACGG TCGTGCTCAA CACCGGTGAC GGGCTCAAGA CCCTGAACGC CGTCGACGCC 
GGGGTGAGCG CCACGATCAA GCCGTCGCTG AGCGCCTTCA CCGACGCCGG TCTGGCCTAG

Protein sequence

MAIAATEPTA ARSFGPGTAL SCRECGERYE LTPRFACEFC FGPLEVAYDF GTVTRADIES 
GPKSIWRYRS LLPVPANVAE LPNMAPGLTP LVRADRLAAE LGLDSLHVKD DSGNPTHSFK 
DRVVAIAVEA ARTFGFTTLS CSSTGNLAGA VGAAAARAGF ESCVFIPAGL EEAKVVMASV 
YGGKVVAIDG NYDDVNRFCS ELIGDPVGEG WGFVNVNLRP YYGEGSKTLA YEIAEQLGWR 
LPEQIVVPIA SGSQLTKIDK GFQELVKLGL VEDRPYRIFG AQATGCSPVA QAWDKGIDVI 
QPVKPDTIAK SLAIGNPADG PYVLDIAKRT GGSVEHVGDD EIVDSIKLLA RTEGIFAETA 
GGVTTGVLRK LVREGRLDPK AETVVLNTGD GLKTLNAVDA GVSATIKPSL SAFTDAGLA