Gene Ndas_0804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0804
Symbol
ID	9244649
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	992383
End bp	993432
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	71%
IMG OID
Product	hypothetical protein
Protein accession	YP_003678754
Protein GI	297559780
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.633218
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGCCCG ACGACCTGAG CCGAGTGGAC GAATTCGCCG ACTTCTGGGC TCCCGACCCT 
CCCGAACTCA GCTGGCCGGA CCGCGCCCGG GCCCTGGCGG GGTTCCTCGC CGCCGCGGCG 
CGCCCGGACC GCGCGCGTGT GGCCGCGCTG GCGGTGGCCG TGCTGGGGAG CTTCCTGTTC 
GCGCCCCAGG GCACGGCGGT GGCGGCGCCG GTGCCCGCCG AGCCGGAGGA CATGGGCGCC 
CTCCAGGATC GCGCGGAGGC CCTGAGCGAG GAGTTCAACG GCGAACTGCG CGACATGGAG 
GGCGTCATCC AGGAGGCCGA GCGCGCCGAG GAACGGGCCC AGAGCACCCG CGAGGACGTG 
GAGGAGGCGC GCGAGCAGGT GCGCGCCCTG GCGGTGGCCA CCTACACCAG CAGCGGGATC 
GACCTGTCCA TGTCGCTGTT CGTCGAGGCC GACCCCGACG AGGTCATCGA CCGCGCGGTG 
GTGATCAACT ACCTGTCCAC CAGCAACCAG GACAAGATCG ACCAGCTCAG TGAGGCCCTG 
GAGCGCGACG AGACCGCGCA GCAGAACGCC GAGGAGCAGC TGGCCGCGGC CGAGGAGGAC 
CTGGACGAGC TGGAGGGGCG CCGCGAGGAG GTCCAGGAGA TGATCGCGGA CCACCCCGTG 
CAGCCGATGG GCGGCCAGTA CAACATCACC CCGCGCACCG AGCAGATGCG CGAGCTGATC 
ATCGAGAAGT TCGGCGAGGG CACAGACGTG GGCGGCGTGG GCTGCTACCG GGAGGTCGGC 
GGCTGGGTGG TCGGCGAGCA CCCCAAGGGC CGCGCCTGCG ACTTCATGGT GGACCCCAAC 
GGGAACACGC CCTCACAGGA GCAGATCGAC CGCGGCTACG CGATCGCCGA GTGGGCCCAG 
GAGAACGCCG ACCGCCTCGG CATCATGTAC ATCATCTACC GGCAGCAGAT CTGGGACATC 
CGCCGTGGTG ACGAGGGCTG GCGCGACATG GCCGACCGCG GCAGCATCAC CGAGAACCAC 
TTCGACCACG TGCACATCTC GATGTTCTGA

Protein sequence

MQPDDLSRVD EFADFWAPDP PELSWPDRAR ALAGFLAAAA RPDRARVAAL AVAVLGSFLF 
APQGTAVAAP VPAEPEDMGA LQDRAEALSE EFNGELRDME GVIQEAERAE ERAQSTREDV 
EEAREQVRAL AVATYTSSGI DLSMSLFVEA DPDEVIDRAV VINYLSTSNQ DKIDQLSEAL 
ERDETAQQNA EEQLAAAEED LDELEGRREE VQEMIADHPV QPMGGQYNIT PRTEQMRELI 
IEKFGEGTDV GGVGCYREVG GWVVGEHPKG RACDFMVDPN GNTPSQEQID RGYAIAEWAQ 
ENADRLGIMY IIYRQQIWDI RRGDEGWRDM ADRGSITENH FDHVHISMF