Gene Ndas_0389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0389
Symbol
ID	9244227
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	479333
End bp	480424
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	77%
IMG OID
Product	hypothetical protein
Protein accession	YP_003678343
Protein GI	297559369
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGTCA CCCCCGCGCC CGCGCCCACC GCCGGACCGG CCCCTCACGA CGCCCTGAGC 
CTGCCCGGCG TGCTCGACGC CGGGCAGCTG CACCGCTCGG CCTCCTACCT CGCGCGCTGT 
CAGGAGGACG GCGGGGCCAT CCCGTGGTTC CCCGGCGGGC ACACCGACGT GTGGGACCAC 
GTGGAGTGCG CCATGGCCCT GACCGTGACC GGCCGCAGCG CGCCCGGACA CGCCGAGGCG 
GCCCGACGCG CCTACCTGTG GCTGGCCGAC AGCCGTGCGC CCGGGGGCGG GTGGCCCGCC 
AAGTTCCGCC AGGGCGTCCC GGTGACGCGG CTGCGCGAGG CCAACCACGC CGCCTACCCC 
GCCGTGGGCC TGTTCCACCA CCTGCTCGTC ACCGGCGACA CCGCGTTCGC CGAGCGGATG 
TGGCCGGTGG TCGAGGAGGG ACTGGAGTTC GTCCTGGCCC TGCGCGGCGA GCACGGCGAG 
ATCCTGTGGG CCCGCTCGGA GAACGGCGCC CCCGGGGACC ACGCCCTGCT GACGGTGTGC 
GCGAGCGTGC ACCACGCGCT GCGCTGCGGC GCCGCCCTGG CCGCGCGCCT GGGCCGCTCC 
CGCCCCGCGT GGACGGCCGC CGCCGACCGC CTCGCGGTGC TCATCAACGG GCACGAGGAC 
CTGTTCGCCG ACCGCGGGCG CTTCTCGATG GACTGGTTCT ACCCCGTCCT GGGCGGCGCC 
GTGCGCGGCG CCGCCGCCAA GGAGCGCATC GCCGAGCGCT GGGACCGCTT CGTGGTGCCC 
GGGCTGGGCG TGCGCTGCGT GAGCGACCAG CCGTGGGTGA CCGCGGCGGA GACCTCGGAG 
CTGGTGCTGG CCCTGGCCGC CGTCGGCGAC GTGGACGCGG GCGTGCGCCT CCTGCGGGAC 
GTGCAGCACC TGCGCGACGC CGACGACGGC GCGTACTGGA CGGGCTACCA GTTCGCCGAG 
CAGGTGCGCT GGCCGGTGGA GCGCAGCACG TGGACCTCGG CCGCCGTGAT CCTGGCGGTG 
GACGCGCTCA CCGGGACCAC ACCGGGCTCG CGGGTCTTCC TGCACACCTG GGACGGGGAC 
CCCGCCGACT AG

Protein sequence

MSVTPAPAPT AGPAPHDALS LPGVLDAGQL HRSASYLARC QEDGGAIPWF PGGHTDVWDH 
VECAMALTVT GRSAPGHAEA ARRAYLWLAD SRAPGGGWPA KFRQGVPVTR LREANHAAYP 
AVGLFHHLLV TGDTAFAERM WPVVEEGLEF VLALRGEHGE ILWARSENGA PGDHALLTVC 
ASVHHALRCG AALAARLGRS RPAWTAAADR LAVLINGHED LFADRGRFSM DWFYPVLGGA 
VRGAAAKERI AERWDRFVVP GLGVRCVSDQ PWVTAAETSE LVLALAAVGD VDAGVRLLRD 
VQHLRDADDG AYWTGYQFAE QVRWPVERST WTSAAVILAV DALTGTTPGS RVFLHTWDGD 
PAD