Gene Ndas_4703 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4703
Symbol
ID	9248585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	5583235
End bp	5584386
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	71%
IMG OID
Product	ABC-2 type transporter
Protein accession	YP_003682595
Protein GI	297563621
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.664507
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCGC TGACCATCGG CGTCCTCAAC GTACGCCGCG TCTTCCGCGA CCGGACGAAC 
ATCTTCTTCG TCCTGCTGCT CCCCTTCCTG ATGGTCTTCA TGATGGGGCT GATGTACGGG 
GAGGGGAAAC CGGTCCTGGG CGTCGTCGCG CCTTCCGGCG GAGGGCTCGC CGAGCGCCTC 
GTGGGCGCTC TGGAGGAGGA CGAGCGCATC GACGTCCTGC GTCTGGACGA GACGGAGATG 
CGCGACCTGG TGGAGGCCGG GGACGTCCAG GCGGGCCTGG TGGTCCCGGA CGACTACGGG 
GACCTGGTGC GCGACGGCGG GCAGGTCGAG CTGGAGCTCG TCACACGCGG CAACGACTGG 
GCCGCCGCGG ACGTGGGGAC CTGGGTCCGC TCCGTGGTGG CGCAGGAGTC GGCGCTGCTG 
AGCACCGCCC GGGTCACGGA GAGCGTCCGC GACGACGGGT TCGAGGAGCG CCTGGCGGAC 
GCGGAGGAGA CCGAGGTGTC CGGCGTCCGG GTGGAGGTGG TCACCGCGGG TGAGGCCACG 
TTCCCCGAGG GCGTCTCCTC GCACAGCCTG GCGGCCCCCC CGCTGCTGCT GCTCTACACC 
TTCATCACGG CGCTGACGAC GTCGCTGGGC ATCGTCCAGG CCAGGCGTTC GGGGGTCCTG 
CGGCGCCTGT ACGCCTCCCC CACCTCGGCG GGGTCCATCG TCCTCGGCGA GGCGCTGGGC 
AGGTTCCTCA TCGCCCTGAC ACAGGCCCTG CTGATCCTCT TCGGGTCGGC CCTGCTGTTC 
GGAGTCGCGT GGGGGAACCT GTTCGCCACC TCGCTGGTGG TGACCGCGTT CTGCCTGGTC 
AGCAGCGGTG CTTCGCTACT GCTCGGCAGT CTGGCGAGGA CCGAGGGCGG CGCGTTGGCG 
GCGGCGGTGG GCATCAGCCT CGGGGCGGGC GCGCTCGGCG GCACCATGCT CCCGCTGGAG 
TCCTTCGGCG ACACCATGAC CACCATCGCG TTCCTGACCC CGCACGCCTG GGGCTACGAC 
GCGTTCAGCG CGCTGGTCCG CGACCAGGCC TCACTCGTGG ACGTGCTCCC GCACGTGGGA 
GTGCTCCTCG GGTACGCCGC CGTCCTCCTG GCGCTGGGCG TCTGGCGCTT CCGCGCCGCG 
GTCACCAGGT AG

Protein sequence

MKSLTIGVLN VRRVFRDRTN IFFVLLLPFL MVFMMGLMYG EGKPVLGVVA PSGGGLAERL 
VGALEEDERI DVLRLDETEM RDLVEAGDVQ AGLVVPDDYG DLVRDGGQVE LELVTRGNDW 
AAADVGTWVR SVVAQESALL STARVTESVR DDGFEERLAD AEETEVSGVR VEVVTAGEAT 
FPEGVSSHSL AAPPLLLLYT FITALTTSLG IVQARRSGVL RRLYASPTSA GSIVLGEALG 
RFLIALTQAL LILFGSALLF GVAWGNLFAT SLVVTAFCLV SSGASLLLGS LARTEGGALA 
AAVGISLGAG ALGGTMLPLE SFGDTMTTIA FLTPHAWGYD AFSALVRDQA SLVDVLPHVG 
VLLGYAAVLL ALGVWRFRAA VTR