Gene Ndas_2946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2946
Symbol
ID	9246799
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	3519408
End bp	3521060
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	74%
IMG OID
Product	hypothetical protein
Protein accession	YP_003680862
Protein GI	297561888
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.288376
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTGCTT CTTTACTTCT GGGGCCCCTG CTCAGGCACC CGGGGGAGAC CACCGCCACA 
GTGTGGGTGG AGACGGACGC CCCCTGCGCG GTGCGTGTCG TGGTCGGCGG CGCCGCCGAG 
GCGACCGCCC GGACCTTCAC CGTGCACGGC CACCACTACG CCGTCTGCAC GGTCGCGGGG 
CTGGTCCCGG GCTCCCGCCT GCCCTACGAG GTGTTCCTGG ACGAGGACCG GGTCTGGCCG 
GAGCCGGACA GCCCCTTCCC GCCCAGCACC GTGCGCACCG TGGACCCGGA GGCGCCCACG 
CGGCTGCTGT ACGGGTCCTG CCACACGCCC ACCCACGACA CTCCCGAGGG CGTGGTCCGC 
TACGGCCCCG ACATGCTGCG CGCCACGGCC CGGCGGCTGG CCCGCGAACC GGTCGGGGGC 
AACCTGGCGC TGCTGCTCAT CGGCGACCAG GTCTACGCCG ACGAGGTGCA GGAGTCGATG 
CTCGCGTTCC TGCGCGAGCG TCGCGTCCGC GGGGGCGCCC GCGACGACCC CGACGACGAG 
GTCGTGTACT ACGACGAGTA CGCCGAGCTG TACCGGCAGG CCTGGAGCGA CCCGCAGGTG 
CGGTGGCTGC TGTCCACCGT GCCGACCCTG ATGGTCTTCG ACGACCACGA CGTCCGCGAC 
GACTGGAACA CCTCGGCCGC CTGGCGGCGC GCCATGGACC GCCAGCCCTG GTGGCGCAGG 
CGCATCACCA GCGGTCTGGG CTCCTACTGG GTGTACCAGC ACCTGGGCAA CCTCTCCGAG 
CAGGAGAGGG AGGGCGACCT GCTGTGGAAG CGGGTGCGCG ACGCCGACGG CGACGCCGAG 
GACCTGGTCG ACGCCTTCGC CTGGCAGGCC CACAGCGAGC CGTCGAGCTA CCAGTGGGGG 
CACCACCACG ACTTCGGCGG TGTCCGGCTC GTGATGGCCG ACACCCGCTG CTCCCGCGCC 
CTGGGCGAGG GCGACCCCTC CGACGGGTCC AGGTCGATCC TGGGGCCCCA GGGCCACGAC 
TGGCTGGACG GGCACCTGAC CGGCGGGCCG GACCACGTCG TGGTCGCCTC GACCGTCCCG 
GTGCTGCTGC CCCCGGCCGT GCACCGGTTG GAGGCCTGGA ACGAGGCGGT GTGCGCGGGC 
GCCTGGGGGC GGTGGCTGGC GGGGCCCGCC GAGCGGCTGC GCCAGGACAT CGACCTGGAG 
CACTGGGCCG CCTTCCAGTA CTCCTTCCGC CGACTGTCCG ACACCGTGGG CGAACTCTCG 
CGGGGCGAAC GGGGCCCGGC CCCGGCCACC GTGCTGTTCC TGGGCGGGGA CGTGCACTTC 
TCCTACCTGG CGCGCGCCCG CCACCGCGGG GGCGGCGCGA GCCGGGTGAC CCAGCTGGTC 
TCCTCCCCGC TGTGCAACCA GGCCCCGACG AGCATGCGCC GCATGGTCCG GCTGTCGGTG 
AGCCGCCCGC TGCGCGCGAT CGGGTGGCTG CTGACGCGGC TGGCGGGGGT ACCCGAGCCC 
GATCTGCGCT GGGACCTGGG GTCGGCCCCC TACTTCGGCA ACACCCTGGG CCAGGTGGAC 
TTCGACGGGC GCGCGGCCAG GGCCTCCTGG TACCACTGCG CCCAGGGCGG GGGCGACGCG 
CTGCCCGACG TGCGCATGAC CGCGGACCTC TGA

Protein sequence

MTASLLLGPL LRHPGETTAT VWVETDAPCA VRVVVGGAAE ATARTFTVHG HHYAVCTVAG 
LVPGSRLPYE VFLDEDRVWP EPDSPFPPST VRTVDPEAPT RLLYGSCHTP THDTPEGVVR 
YGPDMLRATA RRLAREPVGG NLALLLIGDQ VYADEVQESM LAFLRERRVR GGARDDPDDE 
VVYYDEYAEL YRQAWSDPQV RWLLSTVPTL MVFDDHDVRD DWNTSAAWRR AMDRQPWWRR 
RITSGLGSYW VYQHLGNLSE QEREGDLLWK RVRDADGDAE DLVDAFAWQA HSEPSSYQWG 
HHHDFGGVRL VMADTRCSRA LGEGDPSDGS RSILGPQGHD WLDGHLTGGP DHVVVASTVP 
VLLPPAVHRL EAWNEAVCAG AWGRWLAGPA ERLRQDIDLE HWAAFQYSFR RLSDTVGELS 
RGERGPAPAT VLFLGGDVHF SYLARARHRG GGASRVTQLV SSPLCNQAPT SMRRMVRLSV 
SRPLRAIGWL LTRLAGVPEP DLRWDLGSAP YFGNTLGQVD FDGRAARASW YHCAQGGGDA 
LPDVRMTADL