Gene Ndas_4467 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4467
Symbol
ID	9248346
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5304893
End bp	5306164
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	74%
IMG OID
Product	secreted protein
Protein accession	YP_003682362
Protein GI	297563388
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.207667
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCATCT ACCAGACCAT CCCCCGCATC GCGGCGTCGG CGCTCATCGC CGCCCCCGTC 
CTCGCCCTGG GCGCCCCGGC CCAGGCCGAG CAGACGACCG GCTGCCTCAG CCGGGACGGC 
GCCACCGTCG AGGAGGCGCG GGTCACCGAG GAGGTCCCGC AGGAGATCCT GCGCAGATCC 
GGGTTCGTCA TGACCGTGGA CCGCTTCACG CGGGAACTGT GCGCGGCGTC GGGCCCGGAG 
GAGGCGAGCG CGGTCGTCGA ACGCCACGGC GACGCGCTCT GGCGCGAGGC GGTGGACCGG 
GTCCAGGGCA ACGCGAGGGT CGAGGGGAGC CTGAGCGCCG GGGACGACCG TCCGGTCTAC 
TGGGCCCGGC TCGCCATGAC CTCGGCCCTC AACCGCTGGC AGCCGGACTT CGAGCTGAGC 
GAGGCCGACC GCGCCGGGCT CGTGGCCGAC ATGGACCGCC GCTCCCGCGG CCACGACGAC 
ACCCACTTCG CCGAGGTCCC CGGGGAGCCC GAGGCCCTCC ACGTCGTCGT GACCGGGTTC 
GACCCGTTCC GCCTCGACAA CGACATCCGC CAGGCCAACC CCTCCGGCGC GGCCGCCCTC 
GCCCTGGACG GGGCGGTGAT CGAGACCGAC GCCGGGGTCG CGGTCGTGGA GACCATGCTC 
TTCCCGGTGC GCTGGCGCGA CTTCACCGAC GGCATGGTCG AGGAGGCCCT CCTGCCGCAC 
TACACCGGCG ACCGGCCGGC CGACACGGTC ATCACCGTCA GCCAGGGCCG ACCGGGCCGG 
TTCGACCTGG AGGCCCACAA CGGCGCCTGG CGCGGTGGCG CCGCGGACAA CGAGTCGGTC 
GGCACGGAGG AGATGGTCCC CGTCCCCGAC GGCGTCCCCA CCGTCACGCC GCAGCCGCAG 
TGGTCGGACT CCTCCCTCGA CCACCCCGCG ATCGTCGAGC AGACCAGCGG CGCGCCGTTC 
CCCGTGGTCG ACAACACCAC GGTGACCGAG ATCCCCGAGG GCGGGACCGA ACCGGTGGTG 
CGCGTGGACG GGCCCACGCC CGGCTCCGAG GCGCGGGCCG GAGGCGGAGG CGACTACCTC 
TCCAACGAGA TCGCCTACCG CAACACCCTG CTGCGCGACG CCACCGGCCT GGACATCCCC 
GCCGGTCACG TGCACACCCC GGTCCTGGAC TTCGGTCCCG GCGACGGCGT CACCGACCCC 
GAGTTCGAGC GGAACCGCGC GGCGATCGTC GGTCAGGTCG AGGACATCGT CGCGGCCGCC 
GTCCGCGGGT GA

Protein sequence

MRIYQTIPRI AASALIAAPV LALGAPAQAE QTTGCLSRDG ATVEEARVTE EVPQEILRRS 
GFVMTVDRFT RELCAASGPE EASAVVERHG DALWREAVDR VQGNARVEGS LSAGDDRPVY 
WARLAMTSAL NRWQPDFELS EADRAGLVAD MDRRSRGHDD THFAEVPGEP EALHVVVTGF 
DPFRLDNDIR QANPSGAAAL ALDGAVIETD AGVAVVETML FPVRWRDFTD GMVEEALLPH 
YTGDRPADTV ITVSQGRPGR FDLEAHNGAW RGGAADNESV GTEEMVPVPD GVPTVTPQPQ 
WSDSSLDHPA IVEQTSGAPF PVVDNTTVTE IPEGGTEPVV RVDGPTPGSE ARAGGGGDYL 
SNEIAYRNTL LRDATGLDIP AGHVHTPVLD FGPGDGVTDP EFERNRAAIV GQVEDIVAAA 
VRG