Gene Ndas_4526 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4526
Symbol
ID	9248406
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5367404
End bp	5368708
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	69%
IMG OID
Product	ErfK/YbiS/YcfS/YnhG family protein
Protein accession	YP_003682419
Protein GI	297563445
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.442716
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGGCA AGACACCTCC GGCGGTGGCG CGTCGTTTCG GTATCGGACT GGCAGCGCTG 
GCGCTGGCCG CCACGGCCTG CACGTCGGGT GAGGCCGAAA CCCAGGGCGG CGGTACCGAC 
GCGGCCAGCG CCGATCCCGC GGAGCTGGTG ATCACTCCCG AGAACGGTGC CGAGGAGGTC 
GCGCCCAACT CCCCCATCCG GGTCACCGCG GAGAGCGGTG TCATCACGGA CGTCCAGGTG 
GAGCAGGTCG TCGCCACCGA GGCCGCGGCG GAGGGCGAGG GCGAGGCGCA GGAGGCCGAC 
CTCTACGCCA TGACCGGCAC CCTCAACGGT GACGCGACCG AGTGGGTCAG CGACTGGAAC 
CTGCGCCCCG GCGCGGAGGT CGTGGTCACC GCGACCGCCG AGAACGACGC CGGTGAGGAG 
ACCGAGGTCG TCCAGGAGTT CACCACCCTG GAGGCGGTCG CCGGACAGCG CCTGGAACTG 
GCCTCCAACT GGCCCGTCTC CGGTGACACC GTCGGCGTGG GCATGCCGAT CGTCATCAAC 
TTCGACCTGC CGGTGACCAA CAAGGCGCAG GTCGAGAACT CCATGGAGGT CATCTCCGAG 
CAGGGCGTCC AGGGCGCCTG GAACTGGGAG ACCGACACGA TGGCCGTGTT CCGGCCCGAG 
GAGTACTGGG AGCCCCACCA GTCCGTGAGC GTCGACCTGC GCCTCGCCGG CGTCGAGGCC 
TCCGAGGGCG TCTACGGCGT GGAGAACCAC CGCATCGACT TCGAGGTCGG CCGCGAGCTG 
ATCATGACCA TGCACGTGCC CGACCACGAG CTGGTCGTCA ACATCGACGG TGAGCACGAC 
CGCACCATCG AGGTGAGCAA CGGCAAGGCC AGCCGCCGCT TCGACACCAC GACCTCCGGC 
ACCCACGTGC TCATGCAGCG CTACGAGCAG ATGACCATGG ACTCCTCCAC CGTGGGCATC 
CCCGAGGGCA CCCCCGGCGC CTACAACGTG GACGTGCAGT ACGCGGTCCG CACCAGTGAC 
AGCGGCGAGT TCCTGCACGA GGCCTCCTAC AACGGCAACA TCGGCAGCGC CAACACCTCC 
AACGGCTGCA CCAACCTGCG CATGGACGAC GCCCGCTGGA TCTTCGAGAA CACCCTCATG 
GGCGACGTCC TGGAGACCAC CGGTACCGAC CGCGAGCTGG AGTGGAACAA CGGCTGGGGC 
TTCTGGCAGA TGTCCTGGGA CGAGTGGCTG GCCGAGAGCG CGACCGGCGA GCCGCAGGTG 
ACCGACGGTT CGGGCACCCC CGGCTCCGTC CACGGCGAGC AGTAA

Protein sequence

MTGKTPPAVA RRFGIGLAAL ALAATACTSG EAETQGGGTD AASADPAELV ITPENGAEEV 
APNSPIRVTA ESGVITDVQV EQVVATEAAA EGEGEAQEAD LYAMTGTLNG DATEWVSDWN 
LRPGAEVVVT ATAENDAGEE TEVVQEFTTL EAVAGQRLEL ASNWPVSGDT VGVGMPIVIN 
FDLPVTNKAQ VENSMEVISE QGVQGAWNWE TDTMAVFRPE EYWEPHQSVS VDLRLAGVEA 
SEGVYGVENH RIDFEVGREL IMTMHVPDHE LVVNIDGEHD RTIEVSNGKA SRRFDTTTSG 
THVLMQRYEQ MTMDSSTVGI PEGTPGAYNV DVQYAVRTSD SGEFLHEASY NGNIGSANTS 
NGCTNLRMDD ARWIFENTLM GDVLETTGTD RELEWNNGWG FWQMSWDEWL AESATGEPQV 
TDGSGTPGSV HGEQ