Gene Ndas_5484 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5484
Symbol
ID	9249387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	678622
End bp	679806
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	73%
IMG OID
Product	hypothetical protein
Protein accession	YP_003683369
Protein GI	297564396
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.188368
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGATA TGTTGCCGGG CGGCGGACTC CAGCAGGACA GGTTTCCGAC GGTGCGCAAG 
GGCGGCTACG ACAAGGCGCA CGTCGACGAC TACTTCGTGC GGACGGACAA CCAGGTCAAG 
AGTCTGCGCG AGCGCCTCCA GCGGCTGGAC GACGAGCTGG AGCAGTACAA GCGCGACCTC 
GCCATCGCCC GCGAGAAGGC GCAGGTCAAG CCGGAGCACG AGCAGATCAG CGAGCGCATG 
GCCGAGATCC TGCGCATCGC CGAGGAGGAG GCCCAGGAGC GCCGCTCCAA GGTCGAGTCC 
GAGGTGAAGG AGGCCGAGAA GAAGGCCCAG GACGAGATCG CCAAGTACCG CAAGGACGCC 
GAGGAGCACG CCGAGCGGAT CCTGTCCTCC GCGCGCTCGG AGGCCCACTC GATGGTCGAC 
AGCGCCAAGA AGGAGTCCGA CCAGCTCCGG GAACAGGCCA AGCAGGAGGG CGAGCGCCGC 
CTGAACGAGG CCGAGGCGCG CGCGAAGAAG ATCCACGACA CCGCGGACCG CAGGCTCGCC 
ACCCTCACCG CCACGCACGC CGAGGCGCTG CGCCGCCTCA AGGACATGCA CTCGACCCTG 
GCCGACCTGG TCGCGGCCGA GGACAAGGCG GGCGCGCTGG AGAGCGGGCT CTCCCGCGAC 
GAGGTGGCCG CCGCGTCCGC CCCGGCCAAG CCGGCCCCGG CCAAGCCCGC CGCGGCGGCC 
AAGGCCCCCG AGCGCGCCGC GGAGCCCTCC CGGCCCCAGC CCCGCCCCGA GGCGGCCGCG 
CCCGCTCCGG CCAAGCCGGC CCCGGACGCG CCCGGGGACA AGGACGAGGC CACCACCAAG 
CTGCCTCCGC TCCAGCAGCA GCCGGACGAG GCGACCGTGC GCATCAGGCC GGTGGCCAAG 
CCGGAGCAGA CCGGCCAGGA CCCGGCGGGG AACTCCTCCC CGAAGGACCA GGCCCAGTCC 
GCTCCCCGCC CCCCGCAGGG CGCCCGCTTC ACCGGTCCCG CCCCCGAGGG CGACCAGAAG 
CCGCAGCCCG GCCCGCAGCA GCCGCAGTCC GGTCCGCAGC AGGGCCAGAA GGGCCAGGAG 
CAGGGCGGCG ATCCGGGCAT CACCGGTATC TACCGCCACC CGGAGTCCGG CCACAACCAG 
CCGCCCAAGG GCGAGGACGG CGTCCGGGTC ATCCGCAAGC CCTGA

Protein sequence

MSDMLPGGGL QQDRFPTVRK GGYDKAHVDD YFVRTDNQVK SLRERLQRLD DELEQYKRDL 
AIAREKAQVK PEHEQISERM AEILRIAEEE AQERRSKVES EVKEAEKKAQ DEIAKYRKDA 
EEHAERILSS ARSEAHSMVD SAKKESDQLR EQAKQEGERR LNEAEARAKK IHDTADRRLA 
TLTATHAEAL RRLKDMHSTL ADLVAAEDKA GALESGLSRD EVAAASAPAK PAPAKPAAAA 
KAPERAAEPS RPQPRPEAAA PAPAKPAPDA PGDKDEATTK LPPLQQQPDE ATVRIRPVAK 
PEQTGQDPAG NSSPKDQAQS APRPPQGARF TGPAPEGDQK PQPGPQQPQS GPQQGQKGQE 
QGGDPGITGI YRHPESGHNQ PPKGEDGVRV IRKP