Gene Ndas_0122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0122
Symbol
ID	9243953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	150807
End bp	152243
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	71%
IMG OID
Product	replication initiation protein
Protein accession	YP_003678078
Protein GI	297559104
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.93008
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCACC CCAGCGACGC CACACAGCCC CGTCGCGCAC CCTCCACAGA GCAGATCAGC 
GAACGCGTAG CGACCGGCGC TCTCGACGAC GTGCTCTCCA CCATCAAGCG CGTGCGGGGC 
TGCTCTGAGC CGCTGCGGCT GCGCGGACAG CTCTCGACCG TGGACACCGC CACCGGGGCC 
TGTGATGCGG TGTGGTCCAC CACCGGCCAA CCCGGACAGG TGCTCATGGT CGCCTGCGGC 
AACCGCCGCG CCTCCCGCTG CCCCGCCTGC GCCGACACCT ACCAGGGCGA CACCTTCCAC 
CTCATCCGCG CCGGACTCGT CGGCGGAGAC AAGGGCGTCC CCGAAGCCGT GCGCTCCCAC 
CCCCGCGTGT TCGCCACCCT GACCGCCCCC AGCTTCGGCC CCGTCCACCG GGGACCGGAC 
GCCTCCGGGC GTGCGGTGGT GTGCCACCCC CGCCGCTCGG GTGCGGCCTG CTACCGCCGC 
CACACCGCAG ACGATGCCCT CATCGGCCAA CCCTTGGACG CGGAGAGCTA CGACTACGAC 
GGGCACGTGC TGTGGAACAA CCACGCCGGG GACCTGTGGA GCCGCTTCAC GGTCTACCTG 
CGCCGCCACC TGGCCGACGC CGCCGGGATC GGACGCACCG AGTTCAACCG CACGGTGCGG 
GTGTCCTACG CCAAGGTGGC CGAGTTCCAA GCCCGGGGGC TGGTCCACTT CCACGCCGTG 
ATCCGCCTGG ACACCAAACG CCCTGACGGC ACCGTGGAAC CTCCCCCGGC CTGGGCGTCG 
GTGGAGCTGC TCACCGCCGC CATTCGTTCC GCCGCTGCGG CCGTGGTGGT CCCGGCCGAG 
ACCGCCAACG GTTCCCGGTT CCTGTCCTGG GGTGAACAGG TGGACGTCCA CGCGATCACC 
TCGGGTGCGT TCGCCTCCGG CGGGGTGGAT GAGGAAGCGG TGGCCGCCTA CATCGCCAAG 
TACGCCACCA AGTCCACTAC CGATGACGGC ACCCTGGACC GGCGCGTGTT CGCCGGGGCT 
CCGCTGGACC ACCTGGGGTT GAGCGACCAC CAGCGCAGGT TGATCCTGAC CTGCTGGCGT 
CTGTCCGAGG TCCCCGGCCT GGAGGAGCGC AAGCTCGACC GGTGGGCGCA CACCCTCGGG 
TTTCGGGGCC ACTTCTCCAC CAAGTCGCGC CGCTACTCCA CCACCCTGGG CCAACTTCGG 
CAGGTGAGGC GGGATTTCCG CGCCGGGCAG GCACGCGCGA TGGGTCATGA CGACCTGCTC 
GGCGACCTGC CCGAGATGAC CGAGGACACC ACGCTCGTAG TCGGCTCGTT CTCCTACGCC 
GGGCAGGGCT ACGCACACCC CGTTGACCGG TGGCTGGCCG AGTCCCACCA CCGCAGCCGG 
GTCTACAGCC GCCGCGTGGG ACGCGAACAG CTCGCAGACC TGGAAGAGGC CGCCTGA

Protein sequence

MPHPSDATQP RRAPSTEQIS ERVATGALDD VLSTIKRVRG CSEPLRLRGQ LSTVDTATGA 
CDAVWSTTGQ PGQVLMVACG NRRASRCPAC ADTYQGDTFH LIRAGLVGGD KGVPEAVRSH 
PRVFATLTAP SFGPVHRGPD ASGRAVVCHP RRSGAACYRR HTADDALIGQ PLDAESYDYD 
GHVLWNNHAG DLWSRFTVYL RRHLADAAGI GRTEFNRTVR VSYAKVAEFQ ARGLVHFHAV 
IRLDTKRPDG TVEPPPAWAS VELLTAAIRS AAAAVVVPAE TANGSRFLSW GEQVDVHAIT 
SGAFASGGVD EEAVAAYIAK YATKSTTDDG TLDRRVFAGA PLDHLGLSDH QRRLILTCWR 
LSEVPGLEER KLDRWAHTLG FRGHFSTKSR RYSTTLGQLR QVRRDFRAGQ ARAMGHDDLL 
GDLPEMTEDT TLVVGSFSYA GQGYAHPVDR WLAESHHRSR VYSRRVGREQ LADLEEAA