Gene Ndas_1247 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1247
Symbol
ID	9245097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1549810
End bp	1550865
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	77%
IMG OID
Product	hypothetical protein
Protein accession	YP_003679192
Protein GI	297560218
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.232923
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGAAC GGCTGACGAA CCTGGAACCA CGCCTGCACG ACGCGCTGGC GGCGTGGGGC 
GTCCACGCGA CCTCGATCGA CCACGTCCCC CTGGGTTTCG GCGACCACCA CTGGAGCGTC 
ACCGACACCG CGGGCCGCCG CTGGTTCACC ACCGTGGCCG ACCTCGCCCG CAAGTCCTTC 
CTCGGCCCGG ACCCGGCCGC CGTGCGGCGG CGCCTCACCC GGGCCATGGA CACCGCCGCC 
CGGCTGCACG ACGACGAGGG GCTCGGCTTC GTCGTCGCGC CCCTGCGCAC CCCGGGCGGG 
GACACCGTCG TCCCGGTCGG CGACGGGTAC GCGCTCAGCG TCTTCCCCCG CGTGGGAGGG 
CGAGTCCGGA GACTTCGGCC AGGAGCTGTC CGCCGACCGG CGGGCCCGGC TCCTGGACAC 
CCTCGCCCAG CTGCACCGCA GCGCACCGGG CGACGCGCCC GCCGTGGAGA CCCGCCTCCC 
CGGCCAGGAC CGGCTCGCCG CGCTGCTGGA CCGCCCCGCC CGCCGTCGGC GACGCGGGGG 
CCCCCACGCC GGGCCCACCG CCGACCTGCT CGCCGAGCAC GCCCCCGGCG CTGCGCGAGC 
GCCTGGCCGA GTCCGACCGC GGCGCGGCCG CCCTGGAGGA CGCGGCGGCG GTCCTCACCC 
ACGGCGAACC CCACCCCGGC AACCTGCTGT GGCGCGGCGA CCGCCCGCTG CTGGTCGACT 
GGGACACCGT CGGCCTGGCC GCCCCCGAGC GCGACCTATG GCTGGTCACC GACGACCCCG 
CCGAACTGGA ACGCTACGCC GAGGTCAGCG GGCACGAGCC CGACCGCGCA CTGCTGGACC 
TGTACCGGCT GCGCTGGGAC CTGCGCGACG TCGTCGAGTT CGTCGACTGG TTCCGCGCGC 
CCCACGAGGG AGGCCCCGAC ACCTCCCAGG CCTGGCGGGA CCTGGTCCGC ATCGTCGAAC 
GCCTCGGCGC CGGGGAGCGG TCCGGCGCCC GCTGACGCTG CCCGGATCCG GCGGCCCGGC 
GGGTCGCGGC CCGCTCGCGC TGTTCGCGGT CGGTAA

Protein sequence

MRERLTNLEP RLHDALAAWG VHATSIDHVP LGFGDHHWSV TDTAGRRWFT TVADLARKSF 
LGPDPAAVRR RLTRAMDTAA RLHDDEGLGF VVAPLRTPGG DTVVPVGDGY ALSVFPRVGG 
RVRRLRPGAV RRPAGPAPGH PRPAAPQRTG RRARRGDPPP RPGPARRAAG PPRPPSATRG 
PPRRAHRRPA RRARPRRCAS AWPSPTAARP PWRTRRRSSP TANPTPATCC GAATARCWST 
GTPSAWPPPS ATYGWSPTTP PNWNATPRSA GTSPTAHCWT CTGCAGTCAT SSSSSTGSAR 
PTREAPTPPR PGGTWSASSN ASAPGSGPAP ADAARIRRPG GSRPARAVRG R