Gene Ndas_3800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3800
Symbol
ID	9247671
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4563412
End bp	4564899
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	74%
IMG OID
Product	hypothetical protein
Protein accession	YP_003681704
Protein GI	297562730
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0830819
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0502051
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGACC TGCCATTCGG TTTCAGCATG CCGAACGATC CCGATGACGA GTCCGGACGC 
CGTTCTGGCG ACTCCGGCTC GGGTGCCGGC AGCGGCGGCC CGGGCGGAGG AGGATCCGGA 
ACGCCGGACG GCTTCCCGTT CGGCGACCCG CAGCAGATGG CCAACATGCT GCGTCAGTTC 
GCCGACATGA TGTCGGCCCA ACCCGGCCCC GCTCCCGGTT CCAGCGGCGA CCAGAGGTCG 
TCGTCCGGTG TGAACTGGGA CATGGCCAAG GACGTCGCGC GCCAGACGGT CGCCCAGGAG 
GGCGACCCGA GCGTTCCGGC GTCCGACTAC GCCAGGGTCG AGGAGGCCCT GCGCCTGGCC 
GACCTGTGGC TCGACCAGGC TACCGACCTG CCGTCGGGCG TCCACACCGC CCAGGCCTGG 
AGCCGGTCGG AGTGGATCGA GCGGACGATG GACTCGTGGG CGCAGCTGTG CGACCCGCTG 
ACCAGCAAGA CCGTCCGGTC GATGGGGCAG AACCTGCCCG AGGAGATGCG GTCCGTGGCC 
GGTCCGCTGC TGGGCATGAT CCAGCAGATG GGCAGCATGA TGGTCGGCCG CCAGGCGGGC 
CAGGCCGTGG GCGAGCTGTC CCGCGAGGTG GTCGGCACCG CCGACATCGG ACTGCCCCTG 
GCCGGTGAGG GCCGTGCGGC GCTGCTGCCC TCCGGCGTGG CGCGCTTCAG CGAGGGCCTG 
GAGGTCCCCG AGGACGAGGT GCGCCTGTAC CTGGCCGCCC GCGAGGCGGC CGTGCACCGG 
CTGTACTCGC ACGTGCCGTG GCTGCGCTCG CACGTGTCCC GGCTGGTCAA CGAGTACGCG 
GACGGGATGT CCTTCGACAT CAGCGGCCTG GAGGACCGGC TCGGCGAGAT CGACCTCACC 
AACCCCGAGG CGCTCCAGGA GGCCCTGGGC GGTGTCGGGG GCGAGGGGCT GTTCCAGCCC 
GAGGACACCC CGCAGCAGAA GGCGGCGCTG GCCCGGTTGG AGACCACCCT GGCGCTGATC 
GAGGGCTGGG TGGCCACCGT GGTCTCGTCC GCGGTGTCGG GCCGTCTGCC GCAGGCGGAC 
GCCCTGGCCG AGGCGACCCG GCGCCGCCGG GCGACCGGCG GGCCCGCCGA GCACACGTTC 
GCCGCCCTGG TCGGCCTGGA GCTGCGCCCG CGCCGCCTGC GCGAGGCGTC CGCGCTGTGG 
TCCGCCCTGG AGGAGGCGCG CGGTGTGGAG GGCCGGGACG CGGTCTGGGA GCACCCGGAC 
CTGATGCCCA CCGGCGACGA CCTGGACGAT CCCGAGGCCT TCGTGCGCGG GGGCGGTGAC 
GGGTTCGGCG ACGCCGACTT CGACATCTCC TCGCTGACCG GGGACGCTCC CGGCCGGGAG 
AGGGCGGGGA CCGACGGGGA CGCGTCCGGG GAGGGGCCTT CCGACGAGGG CGCCCCCGGC 
GGTGACCGGG ACGGCGACGG GGACGACGAC CGGAGAGAGG GCGCGTAG

Protein sequence

MSDLPFGFSM PNDPDDESGR RSGDSGSGAG SGGPGGGGSG TPDGFPFGDP QQMANMLRQF 
ADMMSAQPGP APGSSGDQRS SSGVNWDMAK DVARQTVAQE GDPSVPASDY ARVEEALRLA 
DLWLDQATDL PSGVHTAQAW SRSEWIERTM DSWAQLCDPL TSKTVRSMGQ NLPEEMRSVA 
GPLLGMIQQM GSMMVGRQAG QAVGELSREV VGTADIGLPL AGEGRAALLP SGVARFSEGL 
EVPEDEVRLY LAAREAAVHR LYSHVPWLRS HVSRLVNEYA DGMSFDISGL EDRLGEIDLT 
NPEALQEALG GVGGEGLFQP EDTPQQKAAL ARLETTLALI EGWVATVVSS AVSGRLPQAD 
ALAEATRRRR ATGGPAEHTF AALVGLELRP RRLREASALW SALEEARGVE GRDAVWEHPD 
LMPTGDDLDD PEAFVRGGGD GFGDADFDIS SLTGDAPGRE RAGTDGDASG EGPSDEGAPG 
GDRDGDGDDD RREGA