Gene Ndas_1783 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1783
Symbol
ID	9245633
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2182000
End bp	2183076
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	75%
IMG OID
Product	hypothetical protein
Protein accession	YP_003679717
Protein GI	297560743
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.203269
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.758933
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGGGG CGGCCGTGGA CTGGTACCCG CTGAGGGTGA GCGCCCCGGC CCGACAGCTG 
GTGTTCGGCG GCCACGCCAT CGCCCGCCAC CTGGGCCGGG AGGGGCTGCC CGACTGGGCG 
GTCGCGGAGA CCTGGGAGGT CAGCGACGTC GACGGGAACG GCAGCACGGT ACTCGACGGG 
CCCCTCGCGG GCCGGTCCCT GCGCGAGCTC GTCGCGCGGT GGCCGGAGGG GTTGGTGGGC 
GAGGACTGGT CCGGGGAGGT CTTCCCGGTG CTGACCAAGT TCATCGACGC CTCCGGAACG 
CTGCCGGTGC ACCTGCACGC CGACGACGCC ACCGCCCGGC GGCTGGAGGG ACAGCCCAAC 
GGCAAGACCG AGGCCTGGCA CATCCTCGAC GCGCCTCCCG GCGCCACCGC GCTGTGCGGG 
GTCAGGAGCG GGGTGACCGG GGAGCGGCTC CACCAGGCAC TGCTCGACCA GGACTTCGAC 
GCCGTGCTGC GCCGCCTGCC GGTGCGGCCC GGCGAGACGG TCTACGTCCC GGGCGGCACC 
GTGCACAGTT TCGGCCCCCG GACCCTGGTC TACGAGATCG AGCAGACCTC CGACGTCCAG 
CAGCACGCGA TGCGCTGGGA GATGGAGGAC GGCTCACCGG TCCCGGACGA GCGGTGGCGC 
GCGAACCTGG AGGCGCTGAT GGCCCAGGTC CGGCCGGAGC ACAGGCCCGA CTTCCACCCG 
GGGCTGAGGA TCGGGGTCGG CGACGGCGTG GAGCGGGTGT TCTGCTGCGC CGGACCGCAC 
TTCGCGCTCG AACGCTGGCA CGCGGGCACC GCCGAGCCCC TGCGCCACAC GTTCGCCACC 
GCGCAGGTCC TCACCAACGT CGGGGCGCCC GTCCGGGTGC GCTGCGGCGA CTGGCGTGGT 
GAGCTGGGCC GGGCCCGGAC GCTGCTGCTG CCCGCCGCGT TGGGCGAGGT GGAGATCGCG 
GGCCCGGCCG ACGTGCTGTT CGGCTACCTG CCCGACCTGG ACCGCGACGT GGTCGCCCCC 
CTGGCCGCCG CCGGTTACCC CCGTGAGGCC GTCGCCTTCC TCGGCGAGGG CCTGTGA

Protein sequence

MTGAAVDWYP LRVSAPARQL VFGGHAIARH LGREGLPDWA VAETWEVSDV DGNGSTVLDG 
PLAGRSLREL VARWPEGLVG EDWSGEVFPV LTKFIDASGT LPVHLHADDA TARRLEGQPN 
GKTEAWHILD APPGATALCG VRSGVTGERL HQALLDQDFD AVLRRLPVRP GETVYVPGGT 
VHSFGPRTLV YEIEQTSDVQ QHAMRWEMED GSPVPDERWR ANLEALMAQV RPEHRPDFHP 
GLRIGVGDGV ERVFCCAGPH FALERWHAGT AEPLRHTFAT AQVLTNVGAP VRVRCGDWRG 
ELGRARTLLL PAALGEVEIA GPADVLFGYL PDLDRDVVAP LAAAGYPREA VAFLGEGL