Gene Noca_0979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_0979
Symbol
ID	4599755
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	1028088
End bp	1029302
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	74%
IMG OID	639775581
Product	threonine dehydratase
Protein accession	YP_922188
Protein GI	119715223
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01127] threonine dehydratase, medium form

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGAGG TCCCGACGGT CGGGCTGGCC GACATCGAGG AGGCCCGCCG GGTCCTGGCC 
GGCGTCGCGA TCCAGACCCC GATGGAGGAG TCCCGCTGGC TCTCGGCGAT CGCCGGCGGG 
CCGGTGTGGC TCAAGTGCGA GAACCTCCAG CGCACCGGGT CCTTCAAGCC CCGCGGCGCC 
TACGTGCGCA TCTCCCGGCT CACCCCCGAG GAGCGGGCCC GCGGGGTCGT GGCGGCCTCG 
GCGGGCAACC ACGCGCAGGG CGTGGCGCTG GCCGCGCAGC TGCTCGGCAT CAAGGCCACC 
GTCTTCATGC CCGAGGGGGC GCCGATCCCC AAGGAGAAGG CGACCCGCGG GTACGGCGCG 
GAGGTGCTCT TCCACGGCCG GTACCTCGAG GACGCGCTGG CCGAGGCGAC CGTGTTCGCC 
GAGCGCACCG GCGCGGTGCT GATCCACCCC TTCGACCACG CCGACGTCGT CGCCGGCCAG 
GGCACGGCCG GCCTCGAGAT CCTCGAGCAG GCGCCCGACC TGCAGACGGT GCTGGTCCCC 
ACCGGCGGTG GTGGGCTGCT GGCGGGGGTC GCGATCGCGG TGAAGGCGCG GCGCCCCGAC 
GTCCGGGTGA TCGGGGTGCA GGCGGCCGGC GCCGCGGCGT ACCCCGGCTC GCTCGCCGAG 
GGGCACCCCG TCGCCCTGAC CTCGATGAAG ACGATGGCCG ACGGCATCGC CGTGGGCCTC 
CCGGGGCAGG TCACCTTCGC GGCGGTGCGC GACCACGTCG ACGAGATCGT CACGGTCTCC 
GAGAACTCGC TGTCCCGCTC GGTGCTGGCC GTGCTGGAGC GCGCGAAGAT GCTGGTCGAG 
CCCGCCGGAG CGGCCGCGGT CGCCGCCGTG CTGGACCGGC CGGACATCTT CGCGACCCCC 
GCGGTGGTCG TGCTCTCGGG CGGCAACATC GACCCCCTGC TGCTCGGCAA GGTGATCCGG 
CACGGCATGG CGGCCGCCGG CCGCTACCTG AACCTACGGG TCTGCATCCC CGACCTGCCG 
GGCGGGCTCG CGCAGCTGCT CACCGACATC TCCGCGGTCG GAGCGAACGT GCTCGAGGTC 
GCGCACGAGC GGATCTCACC CACGCTGAAC CTCGACGAGG TCGAGGTGCA CGTCCAGCTC 
GAGACCCGCG GGGAGCCGCA CACCGCGCAG GTGCTGGCGC GCCTGCGCGA GCGCGGCTAC 
CGCGTGTACG AGTAG

Protein sequence

MTEVPTVGLA DIEEARRVLA GVAIQTPMEE SRWLSAIAGG PVWLKCENLQ RTGSFKPRGA 
YVRISRLTPE ERARGVVAAS AGNHAQGVAL AAQLLGIKAT VFMPEGAPIP KEKATRGYGA 
EVLFHGRYLE DALAEATVFA ERTGAVLIHP FDHADVVAGQ GTAGLEILEQ APDLQTVLVP 
TGGGGLLAGV AIAVKARRPD VRVIGVQAAG AAAYPGSLAE GHPVALTSMK TMADGIAVGL 
PGQVTFAAVR DHVDEIVTVS ENSLSRSVLA VLERAKMLVE PAGAAAVAAV LDRPDIFATP 
AVVVLSGGNI DPLLLGKVIR HGMAAAGRYL NLRVCIPDLP GGLAQLLTDI SAVGANVLEV 
AHERISPTLN LDEVEVHVQL ETRGEPHTAQ VLARLRERGY RVYE