Gene Ndas_0466 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0466
Symbol
ID	9244305
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	560688
End bp	562178
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	75%
IMG OID
Product	hypothetical protein
Protein accession	YP_003678419
Protein GI	297559445
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.202142
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCACG CACTGACCCT GCTCCGCGGG GGCCGGGCGC GCCTGCGCGA CTGGCGGCGC 
GGCCGCCCGT TCTGGGGCGG GCTCCTCCTC GTCATCGCCG GAGTCGAGCT GCTGGTCGCA 
CCGGCCGCGC AGAGCCTGAT CCTGCCCATC GACCTGATCG CCTACACCGG TATCGCCGGT 
GTGTCGGGTC CGCTCATCGC GGTACTGCTG ATCACCCTGG GAGCGCTGAG CTGGTTCCAG 
CCCGCGCAGC ACCTCTTCTT CGGGGTGGTC GGGCTCATGC TCGCCCTGGT GTCCTTCGTG 
ACCTCCAACT TCGGCGGCTT CGTCATCGGG ATGCTGCTCG GCATCGTCGG CGGCTCCCTC 
GTCTTCGCGT GGGCGCCCCG CGTGGTCCGC CGCCGAAGGC GCGGCCGGGG ACGCCGACGG 
GTCGCGGACG CCGACGCCGC CGGTCCAGGG GTGTCTGCCG GGGCCCCTCC AGGGGCCGCC 
GTCCCCCGAG GCCCCGAAGC GCCCGACGGG ACCGGTGGGC GCGCGGCCGG GGAGGAACCC 
CCGACCGCCG TCCCCGCCGA GACCGCGCCC GACGCGGGCG TTCCCGGGAC CCCTCCCGGC 
AGGGACACCG GTTCCGCGAC ACCCGACGGG TCCGTCAGCG CCCCCCGGCC TCCGTCCCGG 
CCGCTGGCCG CGCTCGCCCT GCCCCTGGCA CTGGCCGTGA CCCTGGTCGG CGCCGCCGCG 
CCCGCCGACT GGCCCTGGGA CTGGTTCCTG CCCCCGGGCG AGGAGGAGGA GCAGCCCTCG 
CCCTCCCCCT CCCCCTCGGA CGAGCCCTCG GCGAGTCCCA CCGACCGGCC CACCCCGCCG 
GGGCCCGGGC CCGGCGCGGG CGAGGGGGAC GGTCCGGACG AGCGGCCCGA GGACGGGGAG 
ACCGAGGAGG AGCCGGAGGA GGACGGTCGG GACCGGGAGG CGAACCCGGA CGAGTGCGAG 
ATGGGCACCG GTGAGTCCGC CCTGGCGGGG TCAGAGGAGG AGTTCCTGGA CGCCGTCCGC 
GCCTGCCAGG CGGCCCAGGA CGCGGGGGAG CTGCCCGAGG TTCCGCTGGA GGAGGCCCAC 
GACTGCTCCA CCGGCTCGGT CCGCGCCTCC GGCCTGACCG CCGACCGGCT GACGATGAGC 
GGCGCCCGCT ACGACGGCGT GGTGGAGTGC CCCACCCTCG ACGGCCCCCG CAGGTACATC 
CGGCTGACCA TGAGCCGGGC CGACTTCGTC AACGCCGAAC TGTGGTTCGA GGACGCCGGA 
ACCCGGATGA GCCTGGGCCT GCCCACCATG GTCATGGACG GGTCCGTCCA GATGCACATC 
ACCCGCATGC ACGTGCGCAT CCTGGGGATC CCGCTCACCT TCACACCGGA CTTCCCGCCC 
CCGCTGCTGC TGCCGTACAT GATCGTCACC GACGTGGACG TGGACGACCC GCTGGCCAGC 
ACCGACGTCA TGAACATCCC CGACCTCAAC GGCCGCTACG GCGGCGCCTG A

Protein sequence

MAHALTLLRG GRARLRDWRR GRPFWGGLLL VIAGVELLVA PAAQSLILPI DLIAYTGIAG 
VSGPLIAVLL ITLGALSWFQ PAQHLFFGVV GLMLALVSFV TSNFGGFVIG MLLGIVGGSL 
VFAWAPRVVR RRRRGRGRRR VADADAAGPG VSAGAPPGAA VPRGPEAPDG TGGRAAGEEP 
PTAVPAETAP DAGVPGTPPG RDTGSATPDG SVSAPRPPSR PLAALALPLA LAVTLVGAAA 
PADWPWDWFL PPGEEEEQPS PSPSPSDEPS ASPTDRPTPP GPGPGAGEGD GPDERPEDGE 
TEEEPEEDGR DREANPDECE MGTGESALAG SEEEFLDAVR ACQAAQDAGE LPEVPLEEAH 
DCSTGSVRAS GLTADRLTMS GARYDGVVEC PTLDGPRRYI RLTMSRADFV NAELWFEDAG 
TRMSLGLPTM VMDGSVQMHI TRMHVRILGI PLTFTPDFPP PLLLPYMIVT DVDVDDPLAS 
TDVMNIPDLN GRYGGA