Gene Ndas_3439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3439
Symbol
ID	9247306
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4117391
End bp	4118476
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	70%
IMG OID
Product	band 7 protein
Protein accession	YP_003681350
Protein GI	297562376
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.717632
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.970499
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACCCA CCATCGCCCT CATCATCCTC GCGGTCGTCG TCGTGGCCGT CGCCCTGTCG 
GCGATCCGCA TCGTCCCACA GGCCAGGGCG TACAACATCG AGCGCTTCGG CCGCTACATC 
CGCACCCTGA ACCCGGGTCT GAACTTCCTC ATCCCGGGCG TGGACCGCGT CAACTCCAAG 
TTCGACCTGC GCGAGCAGGT GTTCACCTCG CGCCCGCAGC CCGTGATCAC CGAGGACAAC 
CTGGTCGTCA ACATCGACAC CGTGCTGTAC TACCAGGTCA CCGATCCCAG GGCCGCGGCC 
TACGAGGTCG CCAACTACAT CCAGGCCATC GACCAGCTCA CCGTCACCAC GCTGCGCAAC 
GTCATCGGCT CCATGGACCT GGAGAAGACC CTCACCTCCC GCGAGGAGAT CAACACCCGC 
CTGCGCGGGG TCCTGGACGA GACCACCGGC AAGTGGGGCA TCCGCGTCAA CCGCGTGGAG 
ATCAAGGCCA TCGACCCGCC GCCCACCATC AAGGAGGCGA TGGAGAAGCA GATGCGGGCC 
GACCGCGACA AGCGCGCGGC CATCCTCCAC GCCGAGGGCG AGCGCCAGTC GCGCATCCTC 
AAGGCGGAGG GTGCCCGCCA GCAGGCCATC CTGGAGGCCC AGGGCGACCA GCAGGCGGCC 
ATCCTGCGGG CCGACGGCGA GGCCAAGGCG ATCGAGCGCG TGTTCCAGGC GGTGCACGCC 
AACAACGCCG ACGCCAAGGT GCTCGCCTAC AAGTACCTGG AGACCCTGCC GTCCCTGGCC 
GAGGGCGACG GCAACACCTT CTGGGTGATC CCCGGCGAAC TCACCGAGGC GGTCAAGAAC 
GTCAGCCACG CCTTCGCGGG CAACGCCCCG ACGGTTCCCT CCACGGAGAA GGAGGACGAG 
CAGGCCGAAC CCCGGGGACC CGCGCAGCTC ACGGCGCCCG ATCCCACCCG GTCCTCCTCG 
GCGCAGGCGG CCGTGGACGC GGCCGAGGCC GCCGAACGCG CGGTGGCCGA CGCCCGCGAC 
GACGTCCGGC GGGCCGGGTC GGCCCTCGGC GGCTCCCGGC CGCCCGGGCC CCGCGAAGAG 
GACTGA

Protein sequence

MEPTIALIIL AVVVVAVALS AIRIVPQARA YNIERFGRYI RTLNPGLNFL IPGVDRVNSK 
FDLREQVFTS RPQPVITEDN LVVNIDTVLY YQVTDPRAAA YEVANYIQAI DQLTVTTLRN 
VIGSMDLEKT LTSREEINTR LRGVLDETTG KWGIRVNRVE IKAIDPPPTI KEAMEKQMRA 
DRDKRAAILH AEGERQSRIL KAEGARQQAI LEAQGDQQAA ILRADGEAKA IERVFQAVHA 
NNADAKVLAY KYLETLPSLA EGDGNTFWVI PGELTEAVKN VSHAFAGNAP TVPSTEKEDE 
QAEPRGPAQL TAPDPTRSSS AQAAVDAAEA AERAVADARD DVRRAGSALG GSRPPGPREE 
D