Gene Ndas_0085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0085
Symbol
ID	9243916
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	109027
End bp	110172
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	72%
IMG OID
Product	Cystathionine gamma-synthase
Protein accession	YP_003678043
Protein GI	297559069
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.383004
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTCG ACGGGTTTGA AACGCTGGCC ATCCACGCGG GGCAGGAGCC GGACGCCGGA 
ACCGGGTCCG TGGTGGTGCC GATCTACCAG ACGAGCACCT ACGCCCAGGA CGGCGTGGGC 
GGTCTGCGCC AGGGCTACGA GTACTCGCGC ACCGGCAACC CCACGCGCGC GGCCCTGGAG 
GAGTGCCTGG CCGCCCTGGA GTCCGGGGTG CGCGGCCTGG CCTTCGCCTC CGGCATGGCC 
GCCGAGGACA CCCTGCTGCG CACGGTGCTC TCGCCCGGCG ACCACCTGAT CATCCCCGGC 
GACGCCTACG GCGGCACCTT CCGCCTGGTC TCCAAGGTGG TCGAGCGCTG GGGTGTGCAG 
TGGGACGCGG TCGACCAGTC CGACCCCGAG GCCGTGCGCG CGGCCGTGCG GCCCAACACC 
AGGGTGGTGT GGACCGAGAC GCCCACCAAC CCCCTGCTCA ACATCACCGA CATCGAGGCC 
GTCGCGCAGA TCGCGCACGA CGCCGGCGCC CTGCACGTGG TCGACAACAC CTTCGCCTCG 
TCCTACCTCC AGCAGCCGCT GACCCTGGGC GCGGACGTGG TCGTGCACTC CACCACCAAG 
TACCTGGGCG GGCACTCCGA CGTGGTCGGG GGAGCGCTGG TGGTCTCCGA CGCCGAGCTG 
GGCGAGCGGC TGGCCTTCCA CCAGAACACC ATGGGCGCGG TCCCGGGGCC GTTCGACTCC 
TGGCTGACCC TGCGCGGGAT CAAGACCCTG GGCGTGCGCA TGGACCGGCA CAGCGCCAAC 
GCCGAGAAGG TGGTGGCGGC CCTGGAGGGC CACCCCGCGG TGCGCCGGGT GTTCTACCCC 
GGGTTGGACG CCCACCCGGG GCACAAGACC GCCGAACGGC AGATGAGGGC CTTCGGCGGC 
ATGGTCTCCT TCGCCCTGCG CGACGGTGAG AAGGCGGCGC TCGCCCTGTG CGAGCGCACC 
GAGGTCTTCA CCCTCGGCGA GTCCCTGGGC GGGGTGGAGT CCCTGATCGA GCACCCGGGT 
CGGATGACGC ACGCGTCCAC CGCGGGCTCC CCGCTGGAGG TCCCGGCCGA CCTGGTGCGG 
ATCTCCGTGG GCATCGAGTC CGCCGACGAC CTGGTGGCGG ACCTGCTCCA GGCCCTGGAG 
GGCTAG

Protein sequence

MKFDGFETLA IHAGQEPDAG TGSVVVPIYQ TSTYAQDGVG GLRQGYEYSR TGNPTRAALE 
ECLAALESGV RGLAFASGMA AEDTLLRTVL SPGDHLIIPG DAYGGTFRLV SKVVERWGVQ 
WDAVDQSDPE AVRAAVRPNT RVVWTETPTN PLLNITDIEA VAQIAHDAGA LHVVDNTFAS 
SYLQQPLTLG ADVVVHSTTK YLGGHSDVVG GALVVSDAEL GERLAFHQNT MGAVPGPFDS 
WLTLRGIKTL GVRMDRHSAN AEKVVAALEG HPAVRRVFYP GLDAHPGHKT AERQMRAFGG 
MVSFALRDGE KAALALCERT EVFTLGESLG GVESLIEHPG RMTHASTAGS PLEVPADLVR 
ISVGIESADD LVADLLQALE G