Gene Ndas_4154 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4154
Symbol
ID	9248028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4959131
End bp	4960495
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	69%
IMG OID
Product	hypothetical protein
Protein accession	YP_003682055
Protein GI	297563081
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGTTA CGCCAGACGT GGCAACTTCC CCGTCCGCCG GACGTCGGTT TCGTGCCTAC 
ACCACGAAAC ACCTCGACGA GCTCACCACG CGAGCCGGGC TCGCCGCCGA CGAGCGGCTC 
GCGGTGCAGG CGGTGGCCAC CGTGCTGCCG TTCCGGGTCA ACAGCTACGT CGTCGACGAG 
CTGATCGACT GGGACGCGGC TCCCGACGAT CCGATCTACC GCCTGGTCTT CCCGCAGGCG 
GACATGCTGC CCCAGGACGA CGTGTCCCGG ATCGCCGACC TGCTGCGCTC TGGCGCCCAG 
CGCAAGGAGC TGAACGAGGC CGCCAACCAG ATCCGCGCAC GCCTGAACCC GCACCCCGCG 
GGCCAGATGG ACCTCAACGT GCCCAAGCTG GCCAACGAGG AGCCCATCCC CGGCGTCCAG 
CACAAGTACA AGGAGACCGT GCTCTTCTTC CCCAAGCAGG GGCAGACCTG TCACGCGTAC 
TGCACGTACT GCTTCCGCTG GGCCCAGTTC GTCGGCGACG CCGACCTGAA GTTCGCCTCC 
AGCGAGATCG ACCAGCTCGT CGACTACGTC CGCTCGCACC CCGAGGTCAC CAGCGTCCTG 
TTCACCGGCG GCGACCCGAT GATCATGGGC GAGGGGGTCA TCTCCAAGTA CATCGAGCCG 
CTGCTGGAGA TCGAGCACCT GGAGGCCATC CGCATCGGCA CGAAGGCGCT GGCCTACTGG 
CCGCAGCGCT TCGTCACCGA CCCGGACGCC GACGACACCC TGCGCCTGTT CGAGAAGGTC 
GTGGCCTCGG GCAAGAACCT CGCGTTCATG GCCCACTTCT CCCACCCCAA CGAGATGCGG 
CCCGAGCTGG CCCAGGAGGC GGTGCGCCGC ATCCGCGCGA CCGGCGCCGT CATCCGCACG 
CAGGCGCCGC TGATCCGCAC GATCAACGAC GACTCCGCCG TGTGGGAGAG CATGTGGCGC 
ACCCACCTGC GGCACGGCAT GGTCCCGTAC TACATGTTCG TCGAGCGTGA CACGGGTCCG 
CAGGACTACT TCGCGGTGCC GCTGGCGGAG GCCTACGAGA TCTTCCGCGG CGCCTACAAG 
AGCGTCTCGG GACTGGCCCG CACGGTGCGC GGCCCGTCGA TGTCGGCGAC CCCGGGCAAG 
GTCTGCGTGG ACGGCGTCAC CGAGGTGGCG GGCCAGAAGG TCTTCGTCCT GCACTTCATC 
CAGGCGCGCG ACCCCGAACT GGTCGGCAGG CCCTTCTTCG CCGAGTACGA CGAGAAGGCC 
GCGTGGCTGT TCGACCTCAA GCCCGCCCTG GGCGCGACCC ACCTGCCGTG GGAGCAGTCC 
CCGGTCGGCG CTCCCGGCGG CCTGGTCGAC CCCACCCGCC TGTAG

Protein sequence

MSVTPDVATS PSAGRRFRAY TTKHLDELTT RAGLAADERL AVQAVATVLP FRVNSYVVDE 
LIDWDAAPDD PIYRLVFPQA DMLPQDDVSR IADLLRSGAQ RKELNEAANQ IRARLNPHPA 
GQMDLNVPKL ANEEPIPGVQ HKYKETVLFF PKQGQTCHAY CTYCFRWAQF VGDADLKFAS 
SEIDQLVDYV RSHPEVTSVL FTGGDPMIMG EGVISKYIEP LLEIEHLEAI RIGTKALAYW 
PQRFVTDPDA DDTLRLFEKV VASGKNLAFM AHFSHPNEMR PELAQEAVRR IRATGAVIRT 
QAPLIRTIND DSAVWESMWR THLRHGMVPY YMFVERDTGP QDYFAVPLAE AYEIFRGAYK 
SVSGLARTVR GPSMSATPGK VCVDGVTEVA GQKVFVLHFI QARDPELVGR PFFAEYDEKA 
AWLFDLKPAL GATHLPWEQS PVGAPGGLVD PTRL