Gene Ndas_1546 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1546
Symbol
ID	9245396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1892986
End bp	1894311
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	79%
IMG OID
Product	hypothetical protein
Protein accession	YP_003679481
Protein GI	297560507
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.348015
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGCGCTG CCACAATCCG GGACATGCAG ACAGGACCGG ACGTACTCCA CACCACCGAC 
TGGACCCGCG CCTTCCACGC CTACGGCTCC GGCGCCGACA CCCCCGGGCA CCTCGCCAGC 
CTGCTCACCG GCGACGCGCG TGAGCGCGAG CGCGCGCTGG ACCACCTCCA CGGCGCGCTC 
CTGCACCAGG GCACGGTCTA CCCCGCCACC GTCCCCGCCG CCCTGTTCGT CGCCGGGATC 
CTCGACCGCC CCGAACCCGA CGACCCGGCC CGGGGCCCGC TCCCCGAGGC GTCGGACGCG 
GCCCCGGGTG CCCCGCGCCG CGTCCTGCTC GACTTCCTGG CCGCCGCGGC CGAGGGCGCG 
CTGCACCAGA CGCCCCCCGG CCCCGTGCCC GAACCCCCCG CCGGGGCCGA GCTGGACCGG 
GTCTACGCCG CACTGGCCTC CGACGACGAG GACGAGGCGG TCGGGGTCTG GGAGACCCCC 
GCCGTGGACG CGCTCATGCG GAGGGTGGGC CCGGACATGC GCGCCGCCGC GCCCGTGCTG 
TACGCGGCGG TCGAACCCCA CCTGACCGCC TCCGACGCGC ACACGCGCAT GTGCGCGGTG 
GAGGCCGCCT CCGCCCTGGC CCGGCTCGGC GGGCTGGAGC CCGACCTGTC CGGCGCGGCC 
GACATGGCCG AGACCCGCGA CGAGGGCGCG GTGATCGTCC TGGCCCTGGG CGCCTGCGGC 
GCCGACACCA CCGAGTTCCT CGCCCACGCC GACCCCGCCA TCCGCGCCTG CGCCGCGCTG 
GCGCCCGGCC AGCGAGCCAA CCCCGCGGCC ACCGCGGAGC TGGCCGCCGC GCTCGCGGAC 
CCGGAGGCGG CCGACGCCTG GTTCACCAGG CGTCCCGCCC ACTTCACCGG CCACGTGCGT 
TTCGCCCTGG TCCGGGAACT CGCCGAGCGC TCCACCGCCG AGGACGCCGC GCGCCTGCTC 
CCGGTGCTGC GCGCGCTGGC CCCGCTGACC TCACCCCTCA CCGCGGCGGC CGACGCCGGT 
CCGCTGCTGG ACCTGGCCTT CCGCGCCGCC GACACGGGCC GCGGCGCGGC CGCCGACGCG 
GACGACGGCA CCACCGCTGA CGCGGGCGCC GAAACGGGTC CCGACGGGTC GGCGGCCCCG 
TCCGCCACGG GGCCCGCCGC GCCGCGCGAC CCCGCGGAGC TGACCGCCGT CCAGCGCGAC 
TACCTCCGGG TCCTGGCCGA CCACGACGGC TTCTGGGACG GCCGGTTCGC CAACTTCCTG 
GTCGTGCTCG CCCGGCTGGG GCTGCCCCGC GAGCGCCGCG GGCTCCGCGC GCTGCTCGCG 
GCCTGA

Protein sequence

MGAATIRDMQ TGPDVLHTTD WTRAFHAYGS GADTPGHLAS LLTGDARERE RALDHLHGAL 
LHQGTVYPAT VPAALFVAGI LDRPEPDDPA RGPLPEASDA APGAPRRVLL DFLAAAAEGA 
LHQTPPGPVP EPPAGAELDR VYAALASDDE DEAVGVWETP AVDALMRRVG PDMRAAAPVL 
YAAVEPHLTA SDAHTRMCAV EAASALARLG GLEPDLSGAA DMAETRDEGA VIVLALGACG 
ADTTEFLAHA DPAIRACAAL APGQRANPAA TAELAAALAD PEAADAWFTR RPAHFTGHVR 
FALVRELAER STAEDAARLL PVLRALAPLT SPLTAAADAG PLLDLAFRAA DTGRGAAADA 
DDGTTADAGA ETGPDGSAAP SATGPAAPRD PAELTAVQRD YLRVLADHDG FWDGRFANFL 
VVLARLGLPR ERRGLRALLA A