Gene Ndas_5437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5437
Symbol
ID	9249340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	624560
End bp	625786
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	67%
IMG OID
Product	hypothetical protein
Protein accession	YP_003683322
Protein GI	297564349
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.145957
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCA CCACCGCGGT CAGCGACCTC GCCGCCCGCA TCCACGCGAT CGACTGGGAC 
GGCGACGTGG AACACACGCG GTCGCGGGTC GCGCTGATGC GCGAGTACCT GCGCCGCTCG 
GCCGTGTGGA CACGTGCCCT GGGTACCAGG GGATGGCCGT TCTACGACAT CGCGGAATTC 
GCGGCGCCGG GCGTGCGCGC CGCGGACGAG GTGGTCGAAG GTGTGCTGGA GAGCCCGGTG 
GTCATCGATC AGTACCCGAC GGTGGGCAGG AGCTGCGTGT GGGCGCTGCA CCTGGCAGCA 
GCCCGCGATG CCGGAGTGCC CCTGCCGGAC CTGCCCGATC CCTTCGAACC GCTGATCCGC 
ATGTACGAGC GCGGCGGCGG CTTCTCCCTG TCGACCACCG GCACGATCGA CATCGACACG 
GCGGGCCTGT ACCGGGGCAG GCTCCCCGAC CACCTCGGGG GCGAGCCCAG GGCTCCCGAG 
ACCGAGGCCG GGCTCGACGC CCTCGACGGC GTCGGCGGCT GCCCCCCGGT GCCGTACGCC 
CGGCGCACGG CACCGCCAAC GAACCCCCTC CCTCCTTTCA CTCCCGGATT TCGACCGAAA 
AGGATTCCAG GAGAGGCAGG GAAACCTCAA CAGTCATGCG GAGCGGCACG GCAGGAACCG 
CCCCGAGGAA ACGAATGGAA CAGGAGCCCT ACCTTCGGAA ACCCCGGTGG ACTGGATACT 
CAACGGGGTG GAACAGACGA CTCCGGATTA CGGCAACCGT CCCACGCGGA ACCCGGGGAA 
GGAGCGGAAG GAAGTTCGAT GGATCTTGCC GAGCAGCAGG AGCTGGTGCG CGACATGGCA 
CTTGAACTGG TCGAGGCCGC TCCGGACGGC TGGACCTCGA TGAACTACCG GTATGACTAC 
ATCGGGGGCG GCGCGGCGAG CGAGAACCTC GTGACCTTCG AGAACGGAGA GACGGAGAGG 
AAGCGCCATC CGCGCTCCGT CGACAAGAAG GCCAAGTTCC TCAAGAGTGA GATGTACCAG 
GAGGGCAAGG GGACCTGGCT CGGCATGTCG ATCTCGGTGA CCAGGCCCGG GAAGTTCAAC 
GCGCAATTCC ACTACGACAA GGAGCTGGGG GTCCACCCGA TCCCCCCGTC TCCGGACAGC 
TACGTCTTCG AACTGGGGAA GTTCCCCCGG AACGACGACG CGCTCTCCGA CTGGCTCAGG 
GAGCGGATCG ACCAGGCGCG GGGCTGA

Protein sequence

MSTTTAVSDL AARIHAIDWD GDVEHTRSRV ALMREYLRRS AVWTRALGTR GWPFYDIAEF 
AAPGVRAADE VVEGVLESPV VIDQYPTVGR SCVWALHLAA ARDAGVPLPD LPDPFEPLIR 
MYERGGGFSL STTGTIDIDT AGLYRGRLPD HLGGEPRAPE TEAGLDALDG VGGCPPVPYA 
RRTAPPTNPL PPFTPGFRPK RIPGEAGKPQ QSCGAARQEP PRGNEWNRSP TFGNPGGLDT 
QRGGTDDSGL RQPSHAEPGE GAEGSSMDLA EQQELVRDMA LELVEAAPDG WTSMNYRYDY 
IGGGAASENL VTFENGETER KRHPRSVDKK AKFLKSEMYQ EGKGTWLGMS ISVTRPGKFN 
AQFHYDKELG VHPIPPSPDS YVFELGKFPR NDDALSDWLR ERIDQARG