Gene Ndas_4949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4949
Symbol
ID	9248837
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	86920
End bp	88242
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	71%
IMG OID
Product	peptidase M20
Protein accession	YP_003682837
Protein GI	297563864
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.138857
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGAGC CAGGCAGGGA ACTGAGCGCG GCCGAGGTCG AGGTGGTCGA CCTGTGCCGG 
GAGCTCATCG AGTTCGACAC CTCCAACTAC GGCGACCACT CGGGACCCGG GGAGCGCAAG 
GCGGCCGAGT ACGTGGCGGC CAAGCTCGAC GAGGTCGGCG TCGAGTCGAG GATCTACGAG 
AAGCACCCGG GGCGCAGCAA CGTCGTGGCC CGGATCACGG GGGAGGACTC CAGTCGTCCC 
CCGCTGCTCA TCCACGGCCA CCTCGACGTC GTTCCGGCGG CCCCGGAGGA CTGGACCCAC 
CACCCCTTCG CGGGCGAGGT CGCCGACGAC TGCGTGTGGG GCCGCGGCGC GGTCGACATG 
AAGGACATGA ACGCGATGGT CCTGGCGATG CTGCGCCAGC GCCTGCGCGA GGGCCGCCGT 
CCCCCGCGCG ACATCGTGCT GGCCTTCCTC GCCGACGAGG AGGCCGGGGG CACCTGGGGC 
GCCCAGTACC TGGTCGACGA GCACCCCGAC CTGTTCGCCG ACTGCGACTC GGCGATCAGC 
GAGGTCGGCG GCTTCTCGTT CACGGTCAAG GAGAACCGGC GCCTCTACCT CATCGAGACC 
GCCGAGAAGG GCATCGCCTG GATGAAGCTG ACCGCGCGCG GCACCGCCGG GCACGGTTCG 
ATGGTCAACA CCGACAACGC CGTCACCGAA CTGGCGGCGG CCGTCGCCCG CCTGGGCGAG 
CACCGGTTCC CCGTCCAGCT CACACCGACC GTGCGGACCT TCCTGGAGGA GATCTGCGAG 
GAGTTCGGCA TCCCCTTCGA CGAAGGGGAC GTGGACGCCA CGGTCGCCCG CCTGGGCCCC 
ATCGCGCGCA TGATCGGCGC TACCCTGCGC AACACCCTCA ACCCCACGGT CCTGGGCGGC 
GGCTACAAGG CCAACGTCAT CCCGGGCGAG GCCACCGCCC AGGTGGACGG CCGCTTCCTG 
CCGGGCACCG AGGACGCGTA CTTCGCCGAG ATCGACCGGC TGCTGGGCCC CAAGGTCAGC 
CGCGAGTTCA TCCACCACCT GCCCGCCGTG GAGACCTCCT TCGACGGCGG CCTGGTCAGC 
GCCATGTCGG AGTCGCTGCT GGCCGAGGAC CCCGGCGCCA AGGCCGTCCC CTACTGCCTC 
TCCGGGGGGA CGGACGCCAA GAGCTTCTCG CGGCTCGGGG TGCGCAACTA CGGTTTCGCC 
CCCCTCCAGC TGCCCCCCGA GCTGGACTTC GCGGGCATGT TCCACGGGGT GGACGAGCGC 
GTCCCGATCG AGGGCCTCCG GTTCGGGGTC CGCGTCCTGG ACCGTTTCGT CGGGTTGAGC 
TGA

Protein sequence

MAEPGRELSA AEVEVVDLCR ELIEFDTSNY GDHSGPGERK AAEYVAAKLD EVGVESRIYE 
KHPGRSNVVA RITGEDSSRP PLLIHGHLDV VPAAPEDWTH HPFAGEVADD CVWGRGAVDM 
KDMNAMVLAM LRQRLREGRR PPRDIVLAFL ADEEAGGTWG AQYLVDEHPD LFADCDSAIS 
EVGGFSFTVK ENRRLYLIET AEKGIAWMKL TARGTAGHGS MVNTDNAVTE LAAAVARLGE 
HRFPVQLTPT VRTFLEEICE EFGIPFDEGD VDATVARLGP IARMIGATLR NTLNPTVLGG 
GYKANVIPGE ATAQVDGRFL PGTEDAYFAE IDRLLGPKVS REFIHHLPAV ETSFDGGLVS 
AMSESLLAED PGAKAVPYCL SGGTDAKSFS RLGVRNYGFA PLQLPPELDF AGMFHGVDER 
VPIEGLRFGV RVLDRFVGLS