Gene Ndas_3811 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3811
Symbol
ID	9247682
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4573524
End bp	4574900
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	74%
IMG OID
Product	Beta-Ala-His dipeptidase
Protein accession	YP_003681714
Protein GI	297562740
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000599771
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGACGTAC GCGCCCACAT CGAGGCACAC CGGGACGAGT TCGTCTCCTC CCTCAAGGAG 
TGGCTGGCGA TCCCCTCCAT CTCCGCCGAC CCCGCGCACC ACCCCGACGT GGTCCGCTCC 
GCCCGGTGGC TCGCCGACCA CCTCACCGCG ACCGGCTTCC CCACCGTCGA GGTGTGGCAG 
ACCCCCGGCC TGCCCGCCGT GTTCGCCGAG TGGCCCGCCG CCGACCCCGA CGCCCCCACG 
GTGCTCGTCT ACGGACACCA CGACGTCCAG CCCGTCGACC CGGTCCAGGA GTGGGAGACC 
GACCCGTTCG TGCCCACCGA GCGCGGCACC TCCCTGTTCG CGCGCGGGGC CTCCGACGAC 
AAGGGGCAGG TGCTCTTCCA CGCCCTCGGC GTGCGCGCCG CCCTGGCCGC ATCCGGCGCC 
GACGCCCCGC CCGTCACGGT CAAGCTGCTC GTGGAGGGCG AGGAGGAGTC GGGCTCGGTC 
CACTTCGCCG ACCTGATGCG CGCCAACCGC GACCGCCTGG CCTGCGACGT CGTCGTCATC 
TCCGACACCA CCATGTGGGC GGCCGACACC CCGTCCATGT GCGTGGGCAT GCGCGGCGTC 
ACCGACGTGG AGATCAGCCT GTACGGCCCC GAGCGCGACC TGCACAGCGG CTCCTTCGGC 
GGCGCCGTGC CCAACCCGCT CAAGGCCATG AGCGACCTGC TGTCCGGCCT GCACGACGAG 
GACGGCCGGG TGGCGGTCCC CGGCTTCTAC GACGGGGTGG TCGAGGCCAG CCGGGAGGAG 
CGCGAACTCA TCGCCCGGCT GCCCTTCGAC GAGCGCGAGT GGCTGGCCAC CGCCGCCTCC 
ACCGCCACCT GGGGCGAGAA GGGCTACAGC ACGCTGGAGC GGATCTGGCT GCGCCCGACC 
GCCGAGATCA ACGGCATGTG GGGCGGCCAC ACCGGCTCGG GCGGCAAGAC CATCGTCCCT 
CGCTCCGCGC ACGCCAAGGT CAGCTTCCGC CTGGTGCCCG GCCAGGACCC GCTGCACGTG 
CAGGACCGCG TCCGCGCCCA CGTCGAGGCG GCCGTCCCCG AGGGTCTGCG CGCCGAGACG 
GAGTTCGGCG GGCCGGGCGT GCGCGCCTGC GCCTCCGACC TGTCCTCCAC CGCGCTGAAG 
GCGGCCCGCT CGGCCATGGA GCGCGCCTTC GGCACCCAGG TCCTGTTCAC CCGCGAGGGC 
GGCAGCGGCC CCGAGGCCGA CATCGCCGAC ATCCTCGGGG CGCCGCTGGT CTTCCTCGCC 
GTCGGCCTGG ACGAGGACCG CATCCACGCC CCCAACGAGA AGGTGGAGAT CCCCCTGCTG 
CTCAAGGGGG CCGAGAGCGC CGCCTACCTG TGGGAGGAGC TCGGCGGCCT CGGCTGA

Protein sequence

MDVRAHIEAH RDEFVSSLKE WLAIPSISAD PAHHPDVVRS ARWLADHLTA TGFPTVEVWQ 
TPGLPAVFAE WPAADPDAPT VLVYGHHDVQ PVDPVQEWET DPFVPTERGT SLFARGASDD 
KGQVLFHALG VRAALAASGA DAPPVTVKLL VEGEEESGSV HFADLMRANR DRLACDVVVI 
SDTTMWAADT PSMCVGMRGV TDVEISLYGP ERDLHSGSFG GAVPNPLKAM SDLLSGLHDE 
DGRVAVPGFY DGVVEASREE RELIARLPFD EREWLATAAS TATWGEKGYS TLERIWLRPT 
AEINGMWGGH TGSGGKTIVP RSAHAKVSFR LVPGQDPLHV QDRVRAHVEA AVPEGLRAET 
EFGGPGVRAC ASDLSSTALK AARSAMERAF GTQVLFTREG GSGPEADIAD ILGAPLVFLA 
VGLDEDRIHA PNEKVEIPLL LKGAESAAYL WEELGGLG