Gene Ndas_5569 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5569
Symbol
ID	9249472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	772491
End bp	773837
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	77%
IMG OID
Product	ROK family protein
Protein accession	YP_003683454
Protein GI	297564481
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.575796
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.481694
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGGTCG GTTCGGGAAC GGTGAGCTTC CAGACGGTCC GGGAGACCAA CCTGGGCGTC 
GTGCTGCGCA CGGTCCGCGA GCTGGCCCCC TGCTCGCGCG CGGCGGTGGC CGCGGCCACC 
GGGCTGAACA AGACCACGGT GTCCAGCCTG GTCGCCGACC TCATGGCGCG CAGGCTGGTC 
CGCGAGACCG GGCGCTCCTC CCGGCAGCGG GTGGGGCGCC CGGGGGTGCT GCTGGACCTG 
GACGACTCCT CGATCGCGGC GATCGGCCTG GAGGTCAACG TGGACTACCT GTCGGTGGTC 
GCCGTGGACC TGCTCCAGCG CGAACTGGTC AGCCGCCACG TCCCCTTCGA CGCCCGGTCG 
GCCGGGGCGG AGGCGTGCGC GCGGCACATC GCGCGCACCC TGGGCGCGAC GGTGGCCGAC 
CCCGCGCTGC GCGGGCGCAC CGTGGTGGGG GTGAGCGTGG CGGTCCCGGC GCTGATCGAC 
GCGCCCTCGG GGACGGTCAC GCACGCGCCC AACCTGGGCT GGCGCGACGT GCCGCTGCGG 
GACCGGCTGT CGGAGCTGCT GCGCGAGGCC GGGGTGGAGG GCGTCCCGGT GCGGGTGGAC 
AACGACGCGA ACCTGGGCGC GGTGGCCGAG TACCGGGTGG GGTCGTTCGC GGGGACGGCC 
GACCTCGCGT ACCTGACCGG TGAGGTCGGG ATCGGCGCGG GCATCCTGAC CGGGGGCGGA 
CTGCTGCGCG GCGCCAGCGG GTTCGCGGGC GAGGTGGGCC ACCTGTCGCT GGCCCCGGAC 
GGCCCGGAGT GCGCGTGCGG GCGCCGCGGC TGCCTGGAGG CGCTGGCGGG GATCGGGGCC 
ATCCTGCGCG GGGCCGTCCC CGACCGGTTC CCGGACCACC CGCTGTCGGG CAGCGACGTC 
GCCGAGCTGG TGGGGACGGC CGTGGCACGC GCCGAGGCGG GCGAGGACAC CGCCGTCGGC 
GCGCTGGAGC GGGCGGGCAC GTGGCTGGGC CGGGGCCTGG CCGTGCTGAT CAACGTCACC 
AACCCGAGCC TGGTGGTGCT GGGCGGCTAC TTCGTGCCCC TGGGCCCGTG GCTGCTGCCG 
AACTGCCGGG CGGAGGCGGC CGCGAGCGCG TTCGCGCCGG AGGCGGGCGG CTGCCGGGTG 
GAGCTGTCGT CGCTGGGGCT GAGCGCGGCG GCCCGGGGCG GGGCCACCGC GATGATCCAC 
TCGCTCGACG CGGGACTGCT GCCCCTGCCC GAGCCCGTGA CCCGGGCTCC CGATCCCGCG 
TCCGGCGAGG GGCCCGCCGC GGAGCCCGTC GAGCACCCGG CGGCGGACAC GGCGCAGCCG 
GACGGGAACA CCGCGGACAC CGCCTAG

Protein sequence

MSVGSGTVSF QTVRETNLGV VLRTVRELAP CSRAAVAAAT GLNKTTVSSL VADLMARRLV 
RETGRSSRQR VGRPGVLLDL DDSSIAAIGL EVNVDYLSVV AVDLLQRELV SRHVPFDARS 
AGAEACARHI ARTLGATVAD PALRGRTVVG VSVAVPALID APSGTVTHAP NLGWRDVPLR 
DRLSELLREA GVEGVPVRVD NDANLGAVAE YRVGSFAGTA DLAYLTGEVG IGAGILTGGG 
LLRGASGFAG EVGHLSLAPD GPECACGRRG CLEALAGIGA ILRGAVPDRF PDHPLSGSDV 
AELVGTAVAR AEAGEDTAVG ALERAGTWLG RGLAVLINVT NPSLVVLGGY FVPLGPWLLP 
NCRAEAAASA FAPEAGGCRV ELSSLGLSAA ARGGATAMIH SLDAGLLPLP EPVTRAPDPA 
SGEGPAAEPV EHPAADTAQP DGNTADTA