Gene Ndas_3001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3001
Symbol
ID	9246854
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3586619
End bp	3588223
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	75%
IMG OID
Product	histidine ammonia-lyase
Protein accession	YP_003680917
Protein GI	297561943
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.463238
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.112166
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACCCT CGTGTCAGCC CTTCACCAGG GGTCACGCGG GGGGTCAAAT GGGAGGCATG 
TCCACAGCAG TTCCTTCCGT CGTCGTCGGC GATGCGCCGC TCACCCCGGC CCAGATCCTC 
GACGTGGCCC GCCACGGCGC CCGTGTCACC CTGTCCGAGC AGGCCCGAAA GGCCCTCCAC 
CACGGCCGCG AACGGGTCGA GTCGCTCGCC CGCGGCGAGG TCCCCGCCTA CGGGGTCAGC 
ACCGGCTTCG GCGCGCTCGC CACCCGCCAC ATCGCCCCCG ACCTGCGGGC CCGCCTCCAG 
CGTTCGCTCA TCCGCTCGCA CGCCGCCGGG ACCGGACCCG AGGTGGAGGA CGAGGTCGTG 
CGCGCCCTCA TGCTGCTGCG CCTGCGCACC CTGGCCTCGG GCAACACCGG CGTGGAGGTC 
GCCACCGCCG AGACCCTCGC CGCGCTGCTC AACGCCCGCA TCACCCCGGT CGTGCACGAG 
TACGGCAGCC TGGGCTGCTC GGGGGACCTG GCGCCCCTGT CGCACGTGGC GCTGGCCCTG 
ATGGGCGAGG GCCGGGTCCG CGACGCCGCC GGGCGGGACC TGCCCGCCTA CACCGCCCTG 
CACGAGGCCG GGATCCGCCC GGTCGAACTG GGCGCCAAGG AGGGCCTGGC GCTGATCAAC 
GGCACCGACG GCATGCTCGG CATGCTCGTG CTGGCCTGCA TGGACCTGGA GCGCCTGCTC 
AAGGCCGCCG ACATCACCGC CGCCATGAGC GTCGAGGCGC TGCTGGGCAC CGACCGCGTC 
TTCGCCGAGG AGCTCCAGCG CCTGCGCCCC CACCCCGGCC AGGCCGCCTC CGCGGCCAAC 
CTGCGCGCCC TGCTCGACTC CTCGCCCATC GTCGCCTCCC ACCGCGGCCC CGACTGCAAC 
CGGGTCCAGG ACGCCTACTC GCTGCGCTGC GCCCCGCAGG TGGCCGGCGC CGCCCGCGAC 
ACCCTCGCCC ACGCGCTGCT GGTGGCCGGA CGCGAACTCG ACAGCGTCAT CGACAACCCC 
GTGGTCCTGG ACGACGGGCG GGTGGAGTCC AACGGCAACT TCCACGGCGC GCCCGTGGCC 
TACGTGCTCG ACTTCCTGGC CATCGCCGTC GCCGACACCG CCTCCATCGC CGAGCGGCGC 
ACCGACCGCA TGCTCGACGT GTCCCGCTCC CACGGCCTGC CCGCCTTCCT GGCCGACGAC 
CCCGGCGTGG ACTCCGGCCA CATGATCGCC CAGTACACGC AGGCCGCCAT CGTCTCCGAG 
CTCAAGCGCC TGGCCGTGCC CGCCAGCGTC GACTCCATCC CCAGCTCGGC CATGCAGGAG 
GACCACGTGT CCATGGGCTG GTCGGCCGCC CGCAAGCTGC GCCGCGCCGT GGACGGGCTG 
ACCAGCGTGC TGGCGGTGGA GCTGCTCACC GCCGCCCGCG CCCTGGACCT GCGCTCGCCG 
CTGGAGCCCG GCCCCGCCAC CGGCGCCGTG CTGCGCACCG TACGGGAGAA GGTCTCCGGC 
CCCGGCCCCG ACCGCCACCT GGCCCCCGAG ATCGCCGCCG TCGCCGCCCT GATCACCGAC 
GGCTCCGTGG TCGCAGCCGC CGAGTCCGTC GTCCCCCTGG CCTGA

Protein sequence

MEPSCQPFTR GHAGGQMGGM STAVPSVVVG DAPLTPAQIL DVARHGARVT LSEQARKALH 
HGRERVESLA RGEVPAYGVS TGFGALATRH IAPDLRARLQ RSLIRSHAAG TGPEVEDEVV 
RALMLLRLRT LASGNTGVEV ATAETLAALL NARITPVVHE YGSLGCSGDL APLSHVALAL 
MGEGRVRDAA GRDLPAYTAL HEAGIRPVEL GAKEGLALIN GTDGMLGMLV LACMDLERLL 
KAADITAAMS VEALLGTDRV FAEELQRLRP HPGQAASAAN LRALLDSSPI VASHRGPDCN 
RVQDAYSLRC APQVAGAARD TLAHALLVAG RELDSVIDNP VVLDDGRVES NGNFHGAPVA 
YVLDFLAIAV ADTASIAERR TDRMLDVSRS HGLPAFLADD PGVDSGHMIA QYTQAAIVSE 
LKRLAVPASV DSIPSSAMQE DHVSMGWSAA RKLRRAVDGL TSVLAVELLT AARALDLRSP 
LEPGPATGAV LRTVREKVSG PGPDRHLAPE IAAVAALITD GSVVAAAESV VPLA