Gene Ndas_0247 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0247
Symbol
ID	9244081
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	304532
End bp	305920
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	73%
IMG OID
Product	aminoglycoside phosphotransferase
Protein accession	YP_003678202
Protein GI	297559228
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCAAC TCGAAGAACT CCTGGCCGTC TGGCTACCGA GACAGCGCTG GTTCTCCGGC 
AAGGGGATCC CCATCCGCCA GATCCGGGTC GAGAGCAGGT ACACGCTGGT GACGTCGGGC 
CCCGACGGCC CGGACCTGAA CGTCCTGGTC CTCCAGGCCG GGCAGCGGGG CCGCAGTTCC 
CGCTACCAGG TGCTGCTGGG TTCGCGGCCG CCGCGCTCCC TGCCACCGGA CCTGGCGCGC 
GTGGCCATCG GCGTGTGCCA GGTGGCGGGC GGCAGACCCA GGGTGGTCTA CGACGCCGCC 
CACGACGAGG AGCTGACCCG GATGCTCCTG GAGCGGTTCG CCGCCCCCAC CGGGGCCGAA 
CCCTCCGGAA AGGTGCGCTT CCGCAGCCTG CCGGGCGACA GCGTCCGCAC CGGGTCATCC 
GGGCGGCTGC TCACCGGCGA GCAGTCCAAC ACGTCGCTGG TCTTCGGCGA GGACTACATC 
CTCAAGACCT TCCGCAGACT CTGGCCCGGG CCCAACCCGG ACCTGGAGCT GAACATGGCC 
CTGTCGGGAA CCCCGTACGT GGCCCGGCCG TGCGGGTGGA TCGAGGCCGA CCTGGCCGGG 
CACTCCACAC CCACGACGCT GGCCATGCTC CAGACCTACA TCCCGCACGC CACGGACGGG 
TGGGTGCTCG CCACCGCCAA CGTGCGCGCC CTGTTGGAGG GGCCGGGGGA CGGGCGCGAG 
TCCGCGTTCA CCGACGAGGC GGCCCAGCTG GGCCGCACCA CCGCCGAGGT GCACCGGTCG 
CTGGCCCGGA CCCTGCCCAC GGACGTGCTC ACCCCGACGG GCGCGGCCGA GATGGCCGAC 
GCCATGGTGG AGCGCCTGGC GATGGCCAGC GCCGAGGTGC CGGAGCTGGC CGAGCACGCG 
CCCCGGGTGA TGGAGGCCTA CGCCGACTTC TCCGAGGTGG ACGAGCCGCT GCCGATACAG 
CGCATCCACG GCGACTACCA CCTGGGGCAG GCGATCCGGA CCGCGTCCGG ATGGGTGCTG 
CTGGACTTCG AGGGCGAGCC CACCGTGCCG GTGCGCGACC GCCAGCGCCT GTCCAGCCCG 
CTGCGGGACG TGGCGGGGAT GCTCCGCTCC TTCGACTACG CGGCCGGGTA CCTGCTGATC 
GGGCACCCGG GCGACCCCGG TCTGGAGTGG GCGGCCCGCT CCTGGGCCCG GCACAACCGG 
GAGGCGTTCT GCCGGGGCTA CGCCGACGGC GGCGGGGCCG ACCCGGAGAA GCACCTGGCG 
GTCCTGCGGG CCTTCGAGTT CGACAAGGCC GTGTACGAGG TGCTGTACGA GGCCCGGAAC 
CGGCCGAACT GGCTGCGGGT CCCGCTGGAG TCCATCGCCA CCGCCGCCGC GCCTCCCGTG 
CCCGGTTGA

Protein sequence

MSQLEELLAV WLPRQRWFSG KGIPIRQIRV ESRYTLVTSG PDGPDLNVLV LQAGQRGRSS 
RYQVLLGSRP PRSLPPDLAR VAIGVCQVAG GRPRVVYDAA HDEELTRMLL ERFAAPTGAE 
PSGKVRFRSL PGDSVRTGSS GRLLTGEQSN TSLVFGEDYI LKTFRRLWPG PNPDLELNMA 
LSGTPYVARP CGWIEADLAG HSTPTTLAML QTYIPHATDG WVLATANVRA LLEGPGDGRE 
SAFTDEAAQL GRTTAEVHRS LARTLPTDVL TPTGAAEMAD AMVERLAMAS AEVPELAEHA 
PRVMEAYADF SEVDEPLPIQ RIHGDYHLGQ AIRTASGWVL LDFEGEPTVP VRDRQRLSSP 
LRDVAGMLRS FDYAAGYLLI GHPGDPGLEW AARSWARHNR EAFCRGYADG GGADPEKHLA 
VLRAFEFDKA VYEVLYEARN RPNWLRVPLE SIATAAAPPV PG