Gene Ndas_3395 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3395
Symbol
ID	9247260
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4059510
End bp	4060886
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	70%
IMG OID
Product	secreted protein
Protein accession	YP_003681306
Protein GI	297562332
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.201979
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.899466
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTGTCGG AGACGCGAAG GCCCGCGAAC GGACTGCGGT GGGGGACGCT CGGAACGGCA 
CCCCTCCTGG TCACCGCCCT CCTGGCCGTT CCCGGGGCCA GGGCCGACGG GGTGAGCACC 
GGCGGGGGCG TCGTGCACGT GGCCAACCTG CCCAGGCCGG AGGGGCTGGA CGGCACCGCG 
TCCTACAACT CCGACCTGGC GTTCAGCGGC GACTACGCGA TCGGCGGCAA CTACGACGGC 
TTCGTCGTCT ACGACATCTC CGATCCGGAG AACCCGAGCC GGGTCTCCAC GGTCGTGTGC 
CCCGGGAGTC AGGGCGACGT GTCGGTCAGC GGCGACCTGC TCTACCTCTC GGTGGACTAC 
CCGCGCGCCA GCAGCGAGTG CGGCGCGCCC TCGGTGTCGG CCACCGACCC GGACGGCTTC 
GAGGGGATCC GGATCTTCGA CATCTCCGAC AAGGCCAACC CGCAGTACGT GTCGGCGGTG 
CGCACCGACT GCGGTTCGCA CACCAACACG CTGGTGCCGG GCGAGGACGG TGAGCGCGAC 
TACGTGTACG TCTCCTCGTA CTCGCCCTCG AAGGACTTTC CCAACTGCCA GCCGCCGCAC 
GACAGGATCT CCGTCGTCGA GGTTCCGCTG GCGGACCCGG CCTCGGCCCG GGTGGTCAGC 
GAACCGGTGC TGCTGCCGGA CGGCGGCCAC GGGACCACCA CCGGCTGCCA CGACATCACC 
GCCTACCCCG AGCGGAACCT GGCCGCGGCG GCCTGCCTGG GGGACGGACT GCTGCTCGAC 
ATCTCCGACC CGGTGAACCC GGTCGTCACC GAGGCGGTCC AGGACGAGAA CTTCGCGTTC 
TGGCACTCGG CGACCTTCAC CAACGACGCC CGCACCGTGG TCTTCACCGA CGAGCTCGGC 
GGCGGGCACG CGGCCACCTG CGACGCCGGG ACGGGGCCCG AACGGGGAGC CAACGCGGTC 
TACTCTCTGG ACCAGAGCGG GGCGGAACCG AAGCTCGAAT TTCGGAGCTA CTACAAACTG 
CCTCGTCATC AGGCCGAAAC TGAGAACTGT GTGGCGCACA ACGGCTCGCT GATCCCGGTG 
CCCGGCCAGG ACTACTTCGT GCAGTCCTGG TACCAGGGCG GCGTCTCGGT GATCGACCTC 
AACGACCCGG CCGACCCCCG GGAGATCGGC CACTTCGACC GCGGACCCTG GAACCCCGAC 
GCCCTGACGA CGGCGGGCTC GTGGTCGGCC TACTACTACA ACGGCTACGT CTACTCCTCC 
GACATCAGGC GCGGGCTCGA CGTGCTCCGG CTGACCGACT CCCGCCTGGC GGGGGCCGAG 
GAGGTGCGGA TGGAGGAGTT CAACCCGCAG TCGCAGCCGT CCACGCCCTC CGGCTGA

Protein sequence

MVSETRRPAN GLRWGTLGTA PLLVTALLAV PGARADGVST GGGVVHVANL PRPEGLDGTA 
SYNSDLAFSG DYAIGGNYDG FVVYDISDPE NPSRVSTVVC PGSQGDVSVS GDLLYLSVDY 
PRASSECGAP SVSATDPDGF EGIRIFDISD KANPQYVSAV RTDCGSHTNT LVPGEDGERD 
YVYVSSYSPS KDFPNCQPPH DRISVVEVPL ADPASARVVS EPVLLPDGGH GTTTGCHDIT 
AYPERNLAAA ACLGDGLLLD ISDPVNPVVT EAVQDENFAF WHSATFTNDA RTVVFTDELG 
GGHAATCDAG TGPERGANAV YSLDQSGAEP KLEFRSYYKL PRHQAETENC VAHNGSLIPV 
PGQDYFVQSW YQGGVSVIDL NDPADPREIG HFDRGPWNPD ALTTAGSWSA YYYNGYVYSS 
DIRRGLDVLR LTDSRLAGAE EVRMEEFNPQ SQPSTPSG