Gene Ndas_0221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0221
Symbol
ID	9244055
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	278655
End bp	279995
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	70%
IMG OID
Product	ammonium transporter
Protein accession	YP_003678177
Protein GI	297559203
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGACT CCGGCAACAC GGCGTGGCTG CTGATCAGCG CAGCCCTCGT GATGCTCATG 
ACCCCGGGCC TGGCCTTCTT CTACGGAGGC ATGTCACGGG CCAAGAGCGT CCTCAACATG 
ATGCTGATGA GCTTCGCGAG CATCGCGGTC GTGAGCGTGC TCTGGGTCGT CATCGGCCAC 
TCGCTCACCT ACTCCGACGG GCCCGGGGCG CTCGACACCT TCATCGGCGG CCTGGACTAC 
GTCGGCCTGT CCAACCTGAT CGGTGAGATC GAGCCCGCGG CCGAGGACGG CACCGGCGGC 
TACCCGCTGC TGGTCGACGC CGGGTTCCAG ATGATGTTCG CGGTCATCAC CGTGGCCCTC 
ATCAGCGGCG CCATCGCCGA CCGCGCCAAG TTCGGCGCCT GGCTGCTGTT CGTCCCGGTC 
TGGGCTCTCC TGGTCTACTT CCCCGTCGCC CACTGGGTCT GGGGCGAGGG CTGGATCGAG 
CAGCTGGAGA TCGGCGGCTA CACGGTCATC GACTTCGCGG GCGGCACCGC GGTGCACATC 
AACGCCGGCG CCGCCGCGCT GGCGCTGACC TTCGTCCTGG GCCGCCGCAA GGGCTTCGGC 
TCGGAGTCGA TGCGCCCCCA CAACCTGCCG TTCGTCCTGC TGGGCACCGC GCTCCTGTGG 
TTCGGCTGGT TCGGCTTCAA CGCGGGCTCG GCCTACGCCG CCGACGGCAC CGCCGCCCTG 
GCCCTGGTCA ACACCCAGGT CGCCACCGCC GCCGCCACCG GCGCCTGGAT GCTCGTCGAG 
CGCTTCCGCT ACGGCAAGGT CAGCGCGCTG GGCTTCGCCT CCGGCGCCGT CGCGGGCCTG 
GTCGCCATCA CCCCGGCCGC CGCCAACGTC ACGCCGCTCG GCGCCATCGC CGTCGGCCTG 
CTCTCCGGTG CGGTCTGCGC CTACGCCATC AGCTGGAAGT TCAAGTTCAA GTACGACGAC 
GCGCTCGACG TGGTGGGCAT CCACATGGTC GGCGGCATTG TCGGCTCCCT GATCCTCGGC 
CTGGTCGCCG CGGGTGTGGC GGGCGGCTCC GACGGCCTGC TCTACGGCGG CGGCATCGGC 
CTGCTGGCCG TCCAGACCAT CGCCGTCATC GGCGTCATGC TCTACTCCTT CGCCGTCACC 
TGGGTCATCG CCAAGGTCAT CCACCTCGTC ATCGGGTTCC GCATCCCCGA GGAGGTGGAG 
ACCAACGGTC TGGACCACGA GCTGCACGCC GAGTCCGCCT ACGCCTTCGA CGAACTCGAC 
GAGCTCGAGG ACGCGACGGA AGCGGTCTCC CTGCCGACGC CTCCGGGCGG GGAGACGGCC 
TCGCCGAAGG CCAAGGCCTA G

Protein sequence

MIDSGNTAWL LISAALVMLM TPGLAFFYGG MSRAKSVLNM MLMSFASIAV VSVLWVVIGH 
SLTYSDGPGA LDTFIGGLDY VGLSNLIGEI EPAAEDGTGG YPLLVDAGFQ MMFAVITVAL 
ISGAIADRAK FGAWLLFVPV WALLVYFPVA HWVWGEGWIE QLEIGGYTVI DFAGGTAVHI 
NAGAAALALT FVLGRRKGFG SESMRPHNLP FVLLGTALLW FGWFGFNAGS AYAADGTAAL 
ALVNTQVATA AATGAWMLVE RFRYGKVSAL GFASGAVAGL VAITPAAANV TPLGAIAVGL 
LSGAVCAYAI SWKFKFKYDD ALDVVGIHMV GGIVGSLILG LVAAGVAGGS DGLLYGGGIG 
LLAVQTIAVI GVMLYSFAVT WVIAKVIHLV IGFRIPEEVE TNGLDHELHA ESAYAFDELD 
ELEDATEAVS LPTPPGGETA SPKAKA