Gene Ndas_0004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0004
Symbol
ID	9243830
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	5627
End bp	6760
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	74%
IMG OID
Product	DNA replication and repair protein RecF
Protein accession	YP_003677963
Protein GI	297558989
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.780515
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00205006
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTACGTAT CCCACCTGCA ACTGGCCGAC TTCCGGTCCT ACCGCGAGGC CCTCGTGGAG 
ATGGGCCCCG GCGTGAGCGT GTTCGTCGGC GCCAACGGCC AGGGCAAGAC CAATCTGGTC 
GAGGCGATCG GCTACGTGGC CACCCTCGGC AGCCACCGGG TCTCCTCCGA CACCCCGCTG 
GTCCGCCAGG GCGCCCCCCG CGCGATCGTC CGGGCCAAGG TGGTGCGCGA CGAGCGGTCC 
ATGGTCGTGG ACCTGGAGCT CAACCCCGGC AGGGCCAACC GGGCCCGGAT CAACCAGGCG 
CCCGCGGGCC GTCCGCGCGA GGTCCTGGGG ATCCTGCGCA CCGTGCTCTT CGCCCCGGAG 
GACCTGGCCC TGGTCAAGGG CGACCCCGGC GAGCGGCGCC GGTTCCTGGA CGACCTGCTG 
GTGGCGCGCG CGCCCCGGAT GGCGGGCGTG CGCTCGGACT ACGACCGGGT GCTCAAGCAG 
CGCAACGCCC TGCTCAAGTC GGCCTCCGGC CGGATGTTCC GCCAGCGCTC GGCGCCCGAC 
CTGAGCACGC TGGAGGTGTG GGACTCCCAC CTGGCGGAGA CGGGCGCGGA GCTGCTGGCG 
GCGCGGCTGG AGCTGGTGGA GGAGCTGCGC CCGAGGATCG CCGAGGCCTA CGCCGGGCTG 
ACCGACTCCG GGGGCCCGGC CGTCCCCGAC TACCGCAGCG GCGCGGTCCC CGAGGGGGTC 
GAACCGCCGA CCGGCCGTCC ACAGCTTGTG GAAACCCTGC GCGCGGCCAT GGCCGAGGCC 
CGCGACCGCG AGCTCCAGCG CGGCGTCAGC CTGGTGGGCC CGCACCGCGA CGATCTGGTC 
CTGCGACTGG GCGGGATGCC CGCCAAGGGC TACGCCAGCC AGGGCGAGTC CTGGTCGTAC 
GCCCTCTCGC TCAAGCTGGC CGCCTTCGAC CTGCTGCGCT CCGACGGAGA CGACCCGGTG 
CTGATCCTGG ACGACGTGTT CGCCGAGCTG GACAGCGAGC GCCGCCGCAG GCTGGCCGAG 
CGCGTCGGCG ACGCCGAACA GGTCCTGGTG ACCGCGGCCG TGCCCGAGGA CATCCCCAAG 
GAGCTGGACG GGGCCCGGTT CGGCGTGCGC GAGGGGGGCG TCGCGGGTGA GTGA

Protein sequence

MYVSHLQLAD FRSYREALVE MGPGVSVFVG ANGQGKTNLV EAIGYVATLG SHRVSSDTPL 
VRQGAPRAIV RAKVVRDERS MVVDLELNPG RANRARINQA PAGRPREVLG ILRTVLFAPE 
DLALVKGDPG ERRRFLDDLL VARAPRMAGV RSDYDRVLKQ RNALLKSASG RMFRQRSAPD 
LSTLEVWDSH LAETGAELLA ARLELVEELR PRIAEAYAGL TDSGGPAVPD YRSGAVPEGV 
EPPTGRPQLV ETLRAAMAEA RDRELQRGVS LVGPHRDDLV LRLGGMPAKG YASQGESWSY 
ALSLKLAAFD LLRSDGDDPV LILDDVFAEL DSERRRRLAE RVGDAEQVLV TAAVPEDIPK 
ELDGARFGVR EGGVAGE