Gene Ndas_3370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3370
Symbol
ID	9247235
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4026201
End bp	4027304
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	72%
IMG OID
Product	A-factor biosynthesis repeat-containing protein
Protein accession	YP_003681281
Protein GI	297562307
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGATGC CCGTGCACCA CCTCCTCAAC GGCGCCACCG ACACCGTGAC CGCAGGCACG 
GAGGGTCCGG CCCTGGACTA CGAGCGGACC GTTGACCGCA CCGTCGTCCA CCGGGAGTCG 
TTGGCGGAGG TCTTCGTCAC CGACACCCAG CCCCTCGGAG GGGACGCCCA CGCGGCCGCC 
GCCCAGCTCC CCCGTTCACA CGCCTACTAC GGCGACCACC TGCTCCGCCC CCGCCGCCAC 
GACCCCGTGC TGCTGCTCGA AGCATGCCGA CAGGTGGGGC TGGCCATCGC GCACACCCAC 
TACGGCGTCC CCTTCGACCA CAAGTTCGTG CTCACCACCC TGGGCATCAC CATCACGCGC 
CCCGAGCTGA TGACGGTGGG GACGGCTCCG TGCGCCCTCC GCATGCTCTG CTCCGTCGGG 
GACAAGAGGG TCAAGGAAGG ACGCGTCGTC GGCTACGACG CCAGGTTCCG GCTCTTCGTC 
GACGGCACGG AGGTCGGCAA CGCCGTCGTC GGCCTGCGGT TCAAGTCCCC GGCGAGCTAC 
GAGGCGCTGC GCCTGCGCAA CCGCTCCGGC GAGCCGGTCC CCTCCACGGA GACCTTCGAC 
TTCACCGTCG GCGGGGAGCT CCCCGCCCCC TACCTCGTCG GCCGGTCGAA CGGCGACAAC 
GTGGTCCTGA CCGGGCTCAC GGGGGCCGGG GACACCGTGT CGGCCTCCCT GCGCGTGCTG 
CCCCAGCACC CGAGCCTGTT CGACCACGCC CAGGACCACC TGCCGGGCAT GGTCCTGATC 
GAGGCCGGGC GCCAACTGGC CCTGAACACG CTCCTGGAGG TCCGGGGCAC CTCGCCGGCC 
AAGGCCTACC CCACCGAGAT CACCGCCACC TTCACCAGCT TCGGAGAACT GGAGCCCCGG 
ACCGAGTTGC GGGCCGTCAC CGCTCCGGCG GGGGCGGAGG GGCCCGAGGA GGAGGGCGTC 
TACTACACGC AGGGCGGAAT CGTGGAGTTC CTCGCGCCCA CCGGCTGCCC CGAACCCGCC 
CCGACCTCCG TCGAGGTGGA CGTGCTCCAG AGGGGCGCGT CGATCTGCCG GATCGAGGTC 
GGCCTGGTCC GCCTCCCCGC GTGA

Protein sequence

MQMPVHHLLN GATDTVTAGT EGPALDYERT VDRTVVHRES LAEVFVTDTQ PLGGDAHAAA 
AQLPRSHAYY GDHLLRPRRH DPVLLLEACR QVGLAIAHTH YGVPFDHKFV LTTLGITITR 
PELMTVGTAP CALRMLCSVG DKRVKEGRVV GYDARFRLFV DGTEVGNAVV GLRFKSPASY 
EALRLRNRSG EPVPSTETFD FTVGGELPAP YLVGRSNGDN VVLTGLTGAG DTVSASLRVL 
PQHPSLFDHA QDHLPGMVLI EAGRQLALNT LLEVRGTSPA KAYPTEITAT FTSFGELEPR 
TELRAVTAPA GAEGPEEEGV YYTQGGIVEF LAPTGCPEPA PTSVEVDVLQ RGASICRIEV 
GLVRLPA