Gene Ndas_5269 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5269
Symbol
ID	9249167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	433833
End bp	435026
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	78%
IMG OID
Product	hypothetical protein
Protein accession	YP_003683155
Protein GI	297564182
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.827708
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCTCGG GACTGGGCGC GCTCGCCCTC GGCTGGCACG CGCTGTCCAG GACCCGTGCG 
GTCGGCAGCG AGTCCCAGGC ACTCGCCCAG CGGGCGGCCG CGGTCAGCGC CTCGGGCGTG 
GACCCCTTCG CCGTGCGCGA CGTGGCGGTG CTCCACTACG ACGCCCTGGA GGAGATGTCG 
GGCGCCCGCT CCTTCTCCCT GGCGCTGCTC AACAGCGAGG GTGACGGCGT CGTCGTCACC 
TCCATCAACG GGCGCACCGA GTCGCGCACC TACGCCAAGG CGGTGGTGGG CGGGGAGTGC 
GACACCCTGC TCAGCCCGGA GGAGTACCGG GTCGTCCGGT CGGCACGCCT GGGGGAGGGC 
GTCGGCGCCG CCGCGACCGC GGGAGGCCCC CCGGCGCGGG CGGCTTCCTC CGCCGGGGGC 
CGGCCGGTGA CTCCGTCCGC GCCTCGGGAG GAACCCGGGT CCCCGCCAGC CCGGGACGAG 
GAGCGGGGCG CGCGTGAGGG CGCGGAGGCG GTTGACGAGG GATCGGACCG GGAGCGGCGC 
GAGGCCCACC CGGCAGCCTC AACCGGTACG GGCGACTCGG CTGCCCGGAC CGCCTCGGCC 
GCTCCGACAA CCTCAGCCGT CCCGTCCGTC GCGGACGACG GTCGGGAGGA CGTGGAAGAC 
GCTCCGGCAG CCTCAGTCGC CCCGAACGGC ACGGGCGCGA CCCGGGAGAA CGCGGAACCG 
GCTCCGGCGG GCCCGTCAGC ACGGACGGCC CGCGCCACCG AGCCCGTCGC GGATGACAGC 
CGAGAGGCTT CCGAGGTCAT GCCGGCCTCA ACCGGCACGG GAGTCTCGGC CGTCCGGCCC 
GCCTCAACCG CTCCGGCAGC CTCGTTCAAC CCGGCAGTCC CGGGCGGCGG CCGGGAGGAG 
CAGGAGCCCC GCGGCCTCGT CTCCGTGATC CGCAGGACCA TCGGGCGCGC CGGCGCCGAC 
CGTCGGCCCC CCGTCCAGGC CGTGCGGTCG GGTGTCGGAG CGGCGAGGCC CATCGCCTCC 
GCCAACGTCA CGGTGCGGCC GGGGCCCTCC GCCGCCGCGG CGGGGAGCAC GGGGACTTCG 
GCCACCGGGA CCGCGACGGC CGCCGAGCCG CGCCCGGAGG CCCCGACCGA CGAGGGGACC 
GGCGGGGAGG GCACCCGGGA GGCGGAGGCC CCCGCGCCGG AGGCGCGCGG ATGA

Protein sequence

MLSGLGALAL GWHALSRTRA VGSESQALAQ RAAAVSASGV DPFAVRDVAV LHYDALEEMS 
GARSFSLALL NSEGDGVVVT SINGRTESRT YAKAVVGGEC DTLLSPEEYR VVRSARLGEG 
VGAAATAGGP PARAASSAGG RPVTPSAPRE EPGSPPARDE ERGAREGAEA VDEGSDRERR 
EAHPAASTGT GDSAARTASA APTTSAVPSV ADDGREDVED APAASVAPNG TGATRENAEP 
APAGPSARTA RATEPVADDS REASEVMPAS TGTGVSAVRP ASTAPAASFN PAVPGGGREE 
QEPRGLVSVI RRTIGRAGAD RRPPVQAVRS GVGAARPIAS ANVTVRPGPS AAAAGSTGTS 
ATGTATAAEP RPEAPTDEGT GGEGTREAEA PAPEARG