Gene Ndas_0102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0102
Symbol
ID	9243933
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	127685
End bp	129031
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	71%
IMG OID
Product	PhoH family protein
Protein accession	YP_003678059
Protein GI	297559085
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTAGTT CCTCGACCGA TCGCCGTGAC ACCCAGTCCC CCGACCCCCG TACGGAGGTA 
GGCCAGGACG GACGCGTCTA TGTGCTCGAC ACCAGTGTCC TGCTCGCCGA CCCGGCCGCC 
CTGAGCCGGT TCGCCGAGCA CGAGGTCGTC ATCCCCGTGG TGGTGATCAC CGAGCTGGAG 
AGCAAGCGTC ACCACCCGGA GCTCGGGTAC TTCGCTCGTC ACGCGTTGCG CCGCCTGGAC 
GACCTGCGGG TCGCCCACGG CCGTCTGGAC GCCCCGGTAC CGGTGAACGA CGCCGGCGGC 
ACGCTGCGGG TGGAACTCAA CCACAGCGAT CCGCAGATCC TGCCGGCGGG CTTCCGGCTC 
GGCGACAACG ACACCCGGAT CCTCACGGTG GCCCGCAACC TCCAGGAGGA GGGCGGGGAC 
GTCGTGCTGG TGAGCAAGGA CCTCCCCATG CGGATCAAGG CGGCCTCCAT CGGGCTGGCC 
GCCGACGAGT ACCGGGCCGA ACTGGCCATC GAGCACGGCT GGACGGGCAT GGCCGAGCTG 
GACGTGCCCG CGCACCAGAT CGGCGAACTG TTCACCAGCG GCGAGAGCGA CATCGACGCG 
GCCCGCGATC TCCCCTGCCA CACCGGGCTG GTCCTGGTCT CCGAGCGCGG CAAGGCGCTC 
GGCCGGGTCC AGCCCGACAA GTCGGTGAAG CTGGTGCGCG GCGACCGCGA CGTGTTCGGC 
CTGCACGGCC GCAGCGCCGA GCAGCGCATC GCCCTCGACC TGCTCACCGA CCCCGAGGTG 
GGCATCGTCT CCCTGGGCGG ACGCGCGGGC ACCGGCAAGT CGGCGCTGGC GCTGTGCGCC 
GGTCTGGAGG CCGTCCTGGA GCGCCGCCAG CACCGCAAGG TGATGGTGTT CCGGCCGCTG 
TACGCGGTCG GCGGCCAGGA GCTGGGCTAC CTGCCCGGGA GCGAGAACGA CAAGATGACC 
CCGTGGGGCC AGGCGGTGCA CGACACCCTG TCCGCGGTGA CCAGCGAGGA GGTCATCGAG 
GAGATCGTGG ACCGGGGGAT GCTGGAGGTC CTCCCGCTCA CCCACATCCG CGGCCGGTCG 
CTGCACGACG CGTTCGTGAT CGTCGACGAG GCCCAGTCCC TGGAGCGCAA CGTCCTTCTC 
ACGGTCCTCT CCCGCCTCGG CCAGAACTCG CGGGTGGTGC TCACCCACGA CATCGCCCAG 
CGCGACAACC TGCGCGTGGG CCGCCACGAC GGCGTGGTCG CGGTGATCGA GAAGCTCAAG 
GGCCACCCCC TGTTCGCGCA CGTCACCCTG ACCCGGTCCG AGCGGTCGCC GATCGCCGCC 
CTGGTCACGG AGATGCTGGA GAACTGA

Protein sequence

MASSSTDRRD TQSPDPRTEV GQDGRVYVLD TSVLLADPAA LSRFAEHEVV IPVVVITELE 
SKRHHPELGY FARHALRRLD DLRVAHGRLD APVPVNDAGG TLRVELNHSD PQILPAGFRL 
GDNDTRILTV ARNLQEEGGD VVLVSKDLPM RIKAASIGLA ADEYRAELAI EHGWTGMAEL 
DVPAHQIGEL FTSGESDIDA ARDLPCHTGL VLVSERGKAL GRVQPDKSVK LVRGDRDVFG 
LHGRSAEQRI ALDLLTDPEV GIVSLGGRAG TGKSALALCA GLEAVLERRQ HRKVMVFRPL 
YAVGGQELGY LPGSENDKMT PWGQAVHDTL SAVTSEEVIE EIVDRGMLEV LPLTHIRGRS 
LHDAFVIVDE AQSLERNVLL TVLSRLGQNS RVVLTHDIAQ RDNLRVGRHD GVVAVIEKLK 
GHPLFAHVTL TRSERSPIAA LVTEMLEN