Gene Ndas_4945 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4945
Symbol
ID	9248832
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	82720
End bp	84264
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	73%
IMG OID
Product	peptidase S1 and S6 chymotrypsin/Hap
Protein accession	YP_003682834
Protein GI	297563861
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAAGTC GTACTCTCCT GCCCGCTCTC GTCCTCGCGG TGACCGCGAC CGTGGTCACC 
GCGGTCCCGG CGCACGCCAT CGTGGGCGGG AACCCTTCAA CACAGTCGTA TGAGTTCATG 
GGCTCGTTCC AGCCTGACTA CCCAGCGCCG CCGCGCCCGG ACGGCCACGG GTGCGGGGTC 
GTCGTCCTGG CTCCCCAGTG GGTGCTGACC GCCAGCCACT GCGCGGGCAA GAACCCGACC 
AACGCGCGGA CGGGCGTTCC GCGGGGCTGG AGCGTCCGCG TCGGGTCGCC GGACTCCGAC 
TCCGGAGGCG AGGTGGCCGA GGTCGACCAC TACTACCGGC TGGCCACGAG CGGGGACGAG 
GGGGGTTTCT GGGGCAGGGA CCTCGCGCTG ATGCACCTGG AGCGCCCCGT CGAGGCCCAA 
CCGTTGCCCA TCGCCTCGGC CTCGCCACCG CCCGGGACAC CGGTGCGGAT CATGGGCTGG 
GGCATGACGT GCGACGACGC CGGGAACCCC GACTGCTTCC CGACACGGTT GCGGGAGGCC 
GACACCGTGG TGCAGCCGCC CTCGGCGTGC CTCGGCCAGG CGGTCGAGGG CGAGTTGTGC 
GTCGGCAGCC GGGACGGGAG CGTGGCCGCG GCCAACATGG ACTCGGGCGG TCCCGCGCTG 
GTCCGCGAGG ACGGCGCGTG GGCGCTGGCC GGGGTGGTCA GCGGTCCCAG CGGGGAGGGG 
GCGCCCACGC TGTTCACCGA CGCCACCCGG CACACCGGGT GGATCGACGG CGTCGTCTCC 
GGCACCGACG TGCCCCCGGA CGACGAGATC CCGGACGTGG AGGGCATGGT GGACCTCCAG 
GGCTGCGTGG GCTCGGTGGT GCGCACCCCG GCCTCGGAGC CGGACGCGCC GGCGCTGATG 
CTGACCAACG GCCACTGCGT ACGGGAGGAC TGGCCGGCGC CGGGGGAGGC CCTCGTGGAC 
CGGCCCGCCG ACCTGGAGGT GCCCGTGGCC GACCCCCGGG GCTATCCCCG GGTCACCGCC 
CGGGCCGAGC GCCTGGTGTA CGCGACGATG ACCGGAACCG ACGTCGCGCT CTACCGCCTG 
GACCGGACCT ACGAGCAGTT GGCCTCCCAG GGGGCGAAGA CCTTCGAACT CGGCACCACC 
CCCGTGCGCC CCGGCGACGA GGTGACCATG GTCTCTCCCG GCACCCGCTC GGACTGCTCC 
GTCGAGGCCG TGCCCGCGCA CCTGCGCGAG GGCGGCTACC AACAGGACGA CCCGATCCGC 
TACGCCTCCG GTGAGGGATG CCTCCCCTAC CCCGGCATGT CCGGCTCGGT GCTGTTGGCC 
CCCGACGGTT CCACCGTCGT GGGCGTCCAC AACACCCACA ACAGGGACGG CGAGGAGTGC 
ACCGACGACA ACCCCTGCGA GGTGGACGCG GACGGGAACG TGACCTTCGA GCGGGGACGC 
GGTTACGGCC AGCAGGTCCA CACGGTCCCG GCCTGCCTGA CCGACCGTTC GGAGCTGGAC 
CTGTCACGCC GGGGCTGCTC CCTCACCGGC GCCGGGTCGG CCTGA

Protein sequence

MRSRTLLPAL VLAVTATVVT AVPAHAIVGG NPSTQSYEFM GSFQPDYPAP PRPDGHGCGV 
VVLAPQWVLT ASHCAGKNPT NARTGVPRGW SVRVGSPDSD SGGEVAEVDH YYRLATSGDE 
GGFWGRDLAL MHLERPVEAQ PLPIASASPP PGTPVRIMGW GMTCDDAGNP DCFPTRLREA 
DTVVQPPSAC LGQAVEGELC VGSRDGSVAA ANMDSGGPAL VREDGAWALA GVVSGPSGEG 
APTLFTDATR HTGWIDGVVS GTDVPPDDEI PDVEGMVDLQ GCVGSVVRTP ASEPDAPALM 
LTNGHCVRED WPAPGEALVD RPADLEVPVA DPRGYPRVTA RAERLVYATM TGTDVALYRL 
DRTYEQLASQ GAKTFELGTT PVRPGDEVTM VSPGTRSDCS VEAVPAHLRE GGYQQDDPIR 
YASGEGCLPY PGMSGSVLLA PDGSTVVGVH NTHNRDGEEC TDDNPCEVDA DGNVTFERGR 
GYGQQVHTVP ACLTDRSELD LSRRGCSLTG AGSA