Gene Ndas_1630 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1630
Symbol
ID	9245480
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1998970
End bp	2000130
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	67%
IMG OID
Product	Cystathionine beta-lyase
Protein accession	YP_003679565
Protein GI	297560591
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACAGGT CCGACAGGGA AATCTGCATG AGCGCGTGGG AGGGGGCGGA GAACGTCCAC 
GGCGCGGTCG CCCCTCCGGT TTTCCAGACC AGCATTTTCA CCAAACCCTC GTTCGAGGCG 
TTCATCCAGG AGCAGGAACA GGAACACGAG AGGTACGTCT ACAGCCGCGG CGCCAATCCC 
ACGGTGGCCT TTCTGGAGGA GAGGCTGGCC CTTCTGGAGC GCGGCGAGGC CTGTAAGTGC 
TTCGGTTCCG GAATGGGGGC CATCAGCGCC GTCCTGATGA GCCTGCTGCG CGGCGGGGAC 
CACATCCTCT TCGTCAACAG CACCTACGGC CCGGCCCTGG AGATGGCCGA GCACCTGCGC 
GGTTTCGGCA TCGACCACAC CGTGCTGCCC GACGGCACGT CCGACATCGA GCCCCACCTG 
CGCAAGAACA CGGCGCTGGT CTACGTCGAG AGCCCCGGGA CCATGCGGAT GAAGGTCCTG 
GACCTGGCCG CGATCACCCG GACCGCACGG GCCAGGGGCG TCTGGACCGT GATGGACAAC 
ACCTGGTCCA CGCCGCTCTT CCAGAAGCCG ATCCTGGCCG GGGTGGACAT CGTCATCCAC 
TCGTGCACCA AGTACATCGG CGGTCACAGC GACGTCCTGG GCGGGGCGGT GATCGGCCCG 
GCCTCCTTCG TGCGCGACCT CTTCTACACG GGGTTCCAGC TCCTGGGTTC GGTCATGTCG 
GCCGTCGAGG CGTCGATGGT GCTGCGCGGG CTGCGGACGC TGCCGATCAG GATGGCCGAG 
CACGAGCGCA GCGCCGTGCG GGTCATCGAC TACCTGGCGA CCCGGCCCGA GGTGGCGGCG 
ATCCACCACC CCCACCACGA CCACCGGCCC GACGACCCCC TGGTCAAGGA CCAGTTCAGC 
GGTTTCTCCG GGCTGCTCAG TTTCGACCTG AAGGACGGTT CCTTCGAGAA GGTCGCGGCC 
TTCATCAACC GTCTTTCGCT GTTCCGGATC GGCGCGAGCT GGGGCGGTTA CGAAAGCCTG 
GTCACCGCCC CCGTCCGGCC CGGAAACGAG GGGGCGTTGC GGGAGAGGGG ATTCTCCCCC 
GGAATGGTCC GCCTCTCCGT GGGCCTGGAG GGGGCCGACA GCCAGATCGA GGATCTCGAA 
AGGGCCTTCA CCGCACTGTA G

Protein sequence

MDRSDREICM SAWEGAENVH GAVAPPVFQT SIFTKPSFEA FIQEQEQEHE RYVYSRGANP 
TVAFLEERLA LLERGEACKC FGSGMGAISA VLMSLLRGGD HILFVNSTYG PALEMAEHLR 
GFGIDHTVLP DGTSDIEPHL RKNTALVYVE SPGTMRMKVL DLAAITRTAR ARGVWTVMDN 
TWSTPLFQKP ILAGVDIVIH SCTKYIGGHS DVLGGAVIGP ASFVRDLFYT GFQLLGSVMS 
AVEASMVLRG LRTLPIRMAE HERSAVRVID YLATRPEVAA IHHPHHDHRP DDPLVKDQFS 
GFSGLLSFDL KDGSFEKVAA FINRLSLFRI GASWGGYESL VTAPVRPGNE GALRERGFSP 
GMVRLSVGLE GADSQIEDLE RAFTAL