Gene Ndas_4497 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4497
Symbol
ID	9248377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5333668
End bp	5334750
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	70%
IMG OID
Product	arsenical-resistance protein
Protein accession	YP_003682391
Protein GI	297563417
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCTCGA CCGACAGGAC CACCAGTGGT ACGGGTGGGT CCGTCGTCGC GAGACTGTCG 
TTCCTCGACC GGTTCCTCGC GGTGTGGATC CTGCTCGCCA TGGCCGTCGG CCTGGGTCTG 
GGACGCCTGG TCCCGGGGCT GAACGAACTC CTGGCCGCCA TGGAGGTCGG CGGGATCTCC 
CTGCCCATCG CGCTCGGCCT GCTGGTCATG ATGTACCCGG TGCTGGCCAA GGTCCGCTAC 
GACCGTCTGG ACACCGTCAC CCGCGACACC CGGCTGCTGG TCACCTCCCT GGTGATCAAC 
TGGCTCGTCG GCCCCGCGGT GATGTTCGCG CTGGCCTGGA TCTTCCTGGC CGACCTGCCC 
GAGTACCGCA CCGGCCTGAT CATCGTCGGC CTGGCGCGCT GCATCGCGAT GGTCATCATC 
TGGAACGACC TGGCCTGTGG CAACCGCGAG GCCGCCGCGG TGCTGGTCGC GCTGAACTCG 
GTCTTCCAGG TGCTGGTCTT CGGCCTGCTG GGCTGGTTCT ACCTGGACCT GCTGCCCGGG 
TGGCTGGGCC TGGACACCGG CGGCCTGGAC GCCTCCCCCC GGCTCATCGC GCTCAACGTG 
GTGATCTTCC TCGGCGTCCC GCTGGCTGCG GGGTTCCTCA CCCGCCGGAT CGGTGAGCGC 
AGGATGGGCC GCGAGCGCTA CGAGTCGGCC TTCCTGCCCC GGATCGGCCC GTGGGCGCTG 
TACGGGCTGC TGTTCACGAT CGTGCTGCTG TTCGCCCTCC AGGGGGACCG GATCACCAGC 
CAACCGCTGG ACGTGGCGCG CATCGCGGTG CCGCTGCTGG CCTACTTCGC CCTCATGTGG 
TTCGGCGCCT TCGCCTTCGG CAAGGCGGTC GGGATGGACT ACGACCGCAC CGCGACGCTG 
GCCTTCACGG CGGCGGGCAA CAACTTCGAG CTGGCCATCG CGGTCGCGAT CGCGACCTTC 
GGCGTCACCT CGGGCCAGGC CCTGGCCGGG GTGGTGGGCC CGCTGATCGA GGTGCCCGTG 
CTCATCGCCC TGGTGTACGT GTCCCTGGCC TGGCGCAGGC GCTTCGCCCC GGAGCGGAGG 
TAG

Protein sequence

MASTDRTTSG TGGSVVARLS FLDRFLAVWI LLAMAVGLGL GRLVPGLNEL LAAMEVGGIS 
LPIALGLLVM MYPVLAKVRY DRLDTVTRDT RLLVTSLVIN WLVGPAVMFA LAWIFLADLP 
EYRTGLIIVG LARCIAMVII WNDLACGNRE AAAVLVALNS VFQVLVFGLL GWFYLDLLPG 
WLGLDTGGLD ASPRLIALNV VIFLGVPLAA GFLTRRIGER RMGRERYESA FLPRIGPWAL 
YGLLFTIVLL FALQGDRITS QPLDVARIAV PLLAYFALMW FGAFAFGKAV GMDYDRTATL 
AFTAAGNNFE LAIAVAIATF GVTSGQALAG VVGPLIEVPV LIALVYVSLA WRRRFAPERR