Gene Ndas_0743 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0743
Symbol
ID	9244585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	908758
End bp	910140
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	71%
IMG OID
Product	hypothetical protein
Protein accession	YP_003678694
Protein GI	297559720
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.442021
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGGA ACACACGCGG TGACGTCCTG GAGGAGCAGA TCGACCAGTG GCGCGGCTTC 
GTGCGCCGCC GCCGGGCCAT CTCCCCCTCC GACATCGAGG AGATGGAGGA CCACCTGCGC 
GAACAGATCG CCGATCTGGG GGCGAGCGGC CTGGACGACG AGGAGGCCTT CCTCGTCGCG 
GTCAGGCGCA TGGGCAACCT GGACGAGGTG TCGCGGGAGT TCGCGCGCGA GCACTCCCAC 
CGGCTCTGGA AGCAGCTGGT CCTGGTCCCC GAGGCCGAGG ACGGGGCGGG CGGCCTCGCG 
CGCTGGCGCG AACTCGGCGT GGTGATCGCC TTCGCGCTCG GCGCGGGGCT CGCGGTCAAG 
CTCCTGTTCA CGGCGGTCGA CGACGAGTTC GCGCAGTTGC GCAACGTCGC CTTCGTGGTG 
CTCCCGTTCC TGGCGGGGTG GTTCGCCTGG AAACGGCGGG TCACCTGGCG CGTGTGCGCG 
GCGCTGGCCG CCGTCGCGGC GGTACCGGCC CTGGCCGTGA ACCTCTACCC GTTCGAGACG 
GCCCCCGGGC CGTTCCCGGG CCCCGGCATG ACCGCCGTGC TCGCGTTCAC GCACGCCCCG 
GTCCTGCTGT GGCTGCTCGT GGGCGTCCTG CACACGGGCG GGCAGTGGCG GTCCCACGAC 
CGGCGCATGG ACTTCGTGCG CTTCGTGGGC GAGCTGGTGA TGTACCTGGC GCTGATCGTG 
CTGGGGTCCG CGGTCCTGGT CGGCCTCACC TTCGGGGTGC TCTCCCTGGT GGAGGTGGAC 
CTGGAACCGT TCATGGAGGA CTGGCTGCTG CCGTTCGGCG TGCCCGGCGC GCTCCTGGTG 
GCCGCGTGGC TGGTGGAGGC CAAGAAGAGC GTGGTGGAGA ACATCGCGCC CGTCCTGACC 
CGGGTCTTCA CGCCGCTGGC GGTCCTGATG CTGCTCGCGG ACCTGGTGGC GCTCCTGGTG 
AACGGTCCGC TGACCACGGT GGACCGCGAA CTGCTCATCA TCATGGACGC CGTTCTGGTG 
CTGGTCCTGT TCCTGCTGCT GTACTCGGTC TCCGCCCGCG CCCCGCTGTC CCCGCCGGGT 
GTGTTCGACT GGCTCCAGCT CGCGCTGGTC GGGGCGGCGC TCGCGGTGGA CGCCGTCGCG 
CTGACGGCGA TGCTGACCCG TATCGCCGAG TTCGGGTTCA CCGCCAACAA GACCGCCGCG 
CTCGGTCTCA ACCTCGTGCT GCTGGTGCAC CTGGCGTGGT CGGCGTGGCT GATGGCGGGT 
TTCGTACGGG GCACCCGCCC GTTCGCAGCG ATCGAACGGT GGCAGACGGC CTACCTGCCG 
GTCTACGCGG TCTGGGCGGG GCTGGTCGTG CTGGTGTTCC CGCCGGTGTT CGGTTTCGCC 
TGA

Protein sequence

MSGNTRGDVL EEQIDQWRGF VRRRRAISPS DIEEMEDHLR EQIADLGASG LDDEEAFLVA 
VRRMGNLDEV SREFAREHSH RLWKQLVLVP EAEDGAGGLA RWRELGVVIA FALGAGLAVK 
LLFTAVDDEF AQLRNVAFVV LPFLAGWFAW KRRVTWRVCA ALAAVAAVPA LAVNLYPFET 
APGPFPGPGM TAVLAFTHAP VLLWLLVGVL HTGGQWRSHD RRMDFVRFVG ELVMYLALIV 
LGSAVLVGLT FGVLSLVEVD LEPFMEDWLL PFGVPGALLV AAWLVEAKKS VVENIAPVLT 
RVFTPLAVLM LLADLVALLV NGPLTTVDRE LLIIMDAVLV LVLFLLLYSV SARAPLSPPG 
VFDWLQLALV GAALAVDAVA LTAMLTRIAE FGFTANKTAA LGLNLVLLVH LAWSAWLMAG 
FVRGTRPFAA IERWQTAYLP VYAVWAGLVV LVFPPVFGFA