Gene Ndas_1500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1500
Symbol
ID	9245350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1839794
End bp	1840909
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	77%
IMG OID
Product	hypothetical protein
Protein accession	YP_003679436
Protein GI	297560462
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.472105
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000928379
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATCCGGT GGCGCCGTGG TGAAGTCCGT CAGATCCTCC CCTCCTGGCC GGGGGTCGTG 
CTGTGCGCGG TGGCGCTGGA GCCCGTGGCC GAAGCGGACC GCAGAGGCCG CGGGGCCGCG 
GGAGCGGGCG GAGAGGTGAC GTGCCGCGCG CTGGCCTACA CCGACCTGGT GGGCGCGCCC 
GAGGCGGGCG ACACCGTGCT GCTCAACACC GGCGCCCTGG ACCTGGGGCT GGGGACGGGC 
GGGTACGCGC TGGTGGTGGC CGTGCCCGAC CGGCTGCCCC CTGACCCCCG CGGGCCCGGC 
CACCTGGTCA AGGCCCGTTA CACGCCGTTG CAGGCCACCG TGCTGGGCGC CGACGAGCAG 
GGCTCGCCCC ACCACGAGGT GCTGCGCTCG GCCGAGGGTG TGGAGGGCAT GCCGGTGGTG 
GTGGCCGACC TGCACTCGGC GCTGCCCGCC GTGGTGGCGG GGGTGCGCGC GCACCGGCCG 
GGGGCGCGGA TCGTCCACGT GATGCTGGAC GGGGGCGCGC TGCCCGCGGC GTTCTCGCGG 
CTGGTGGGCG CGCTGCGCGA GGAGGGTCTG CTGGCGGGGT GCGTGACCAC GGGGCAGTCC 
TTCGGCGGTG ACCTGGAGGC GGTGACCGTG CATTCGGGGC TGCTGGCTGC CCGGCACGTG 
CTGGGTGCGG ACGTGGCGGT GGTGTGCCAG GGTCCGGGCA ACCTGGGCAC CGGGACGCCG 
TGGGGGTTCT CGGGAGTCTC GTGCGGTGAG GCGGTGAACG CGGCGGCGGT GCTGGGCGGG 
CGTCCGGTGG CGTCGCTGCG GGTGAGCGAG GCCGACGCGC GCGAGCGGCA CCGGGGGGTG 
TCGCACCACA GCCTGACCGC CTACGGGCGG GTGGCGCTGG CGCGGGCGGA GGTGGTGGTG 
CCGCTGCTGC CGGGGGTGTT CGGCGAGCGC GTGCGCGTCC AGGCCGGGGC TCTGGGCGAG 
CGGCACACCC TGGTGGAGGT GGGTGTGGAC GGGCTGGAGG AGGCGGTGCG GACGCTTCCG 
GTGAAGGTGT CGACGATGGG CCGTGGCCTG GAGGAGGACC GCGCGGCCTT CCTGAGCGCC 
GCGGCGGCGG GCCGCCACGC GGCCGCGCTG CTGTAG

Protein sequence

MIRWRRGEVR QILPSWPGVV LCAVALEPVA EADRRGRGAA GAGGEVTCRA LAYTDLVGAP 
EAGDTVLLNT GALDLGLGTG GYALVVAVPD RLPPDPRGPG HLVKARYTPL QATVLGADEQ 
GSPHHEVLRS AEGVEGMPVV VADLHSALPA VVAGVRAHRP GARIVHVMLD GGALPAAFSR 
LVGALREEGL LAGCVTTGQS FGGDLEAVTV HSGLLAARHV LGADVAVVCQ GPGNLGTGTP 
WGFSGVSCGE AVNAAAVLGG RPVASLRVSE ADARERHRGV SHHSLTAYGR VALARAEVVV 
PLLPGVFGER VRVQAGALGE RHTLVEVGVD GLEEAVRTLP VKVSTMGRGL EEDRAAFLSA 
AAAGRHAAAL L