Gene Ndas_1028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1028
Symbol
ID	9244874
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1256032
End bp	1257678
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	76%
IMG OID
Product	AMP-dependent synthetase and ligase
Protein accession	YP_003678977
Protein GI	297560003
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.11647
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00107261
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCCCAGG ACTGGCTGCG CTGGCCGAGG GAGCAGGCGA GGGAGTACCG CGAACGCGGC 
TTCTGGGACG ACCGGAAGCT GGACGGCCTG CTACGCGAGC GGGCCGACCG CCACGGGGAG 
CGCACCGCGC TCGTGTCGGG CGCGGACCGG CTCACCTACG CCGGACTGGA CGGGCGCGTT 
GACCGGCTGG CCGCGGGGCT GGCCTCGCTC GGGGTGGAAC CGGGGGAACG CGTCCTGCTC 
CAGCTGCCCA ACCGGCGCGA GTACGTCGTC ACGCTCTTCG CCCTGCTGCG GATCGGGGCC 
GTGCCGGTCC TGGCCCTGCC GACCCTGGGC GCCGCCGAGG TGGAGTCGCT CGTGCGCACG 
GCGCGGGCGT GCGCCGTCGT CGTCGCGCAG GGCAGGGGCC GCAGCGACCC CAGGGCGGCC 
GCGGCCCGGA TCGCGCGGGA CGTGCCGTCG GTGCGCGCTC TGGTCGTCGT CGGCGACCCC 
GGGGACACCG GCGGGGTGCG GTGGGACGCC CTCGCGGAGG CGGATCCCCT CCCCCGCGGC 
GGCGACGCCG GGGAGAGCGG GCGGCACGGG CGCACCCCCG AGGTCGGCGC CGAGGACCTG 
GCCCTGCTCC TGCTGTCCGG AGGCACCACG GGCACCCCCA AACTCATCCC GCGCACCCAC 
GCCGACTACG GGTACAACGC CCGGGCGTCG GCCGAGGCCT GCGGAGTGGG CGAGGACGCG 
GTCTACCTGG CCGTCCTGCC CGTCGCGCAC AACTTCACCA TGGTCTCCCC CGGGATCGTG 
GGCACCCTCG CGGTCGGCGG CACGGTCGTC CTGAGCCCCG ACCCCAGCCC GACCACGGCC 
TTCGCGCTCA TCGAGCGCGA GGGGGTGACC ATCACCTCGC TCGTGCCCGC GCTGGTGCCC 
TCCTGGCTGG ACGAGGCCGG CCGCACCGGG CACGACCTGT CCTCCCTGCG CGTCCTCCAG 
GTCGGGGGGT CGCGCCTGGA CGACACGACC GCCCGGCGCG TGGGCCCCGC CCTGGGCTGC 
CGCCTCCAGC AGGTGTTCGG CATGGCCGAG GGCCTCAACA ACTACACCGG TCTGGACGAC 
CCCGACGACC TCGTGTGCAC GACCCAGGGC CGCCCCCTCT CGCCCGCCGA CGAGGTCGCG 
GTGGTGGACG AGGCCGGAGA CCCGGTGCCC CCGGGCACCC CCGGGGAACT GCTCACCCGC 
GGCCCCTACA CCCTGCGCGG CTACTACCGG GCGCGCGAAC TGGACGCGCT GCGCTTCACC 
CCGGACGGGT TCTACCGCAC CGGGGACCTG GTGACCCGGA GCGAGGGCGG CGACCTGGTG 
GTCGTGGGCC GGGTGAAGGA CCAGGTCAAC CGGGCCGGCG AGAAGATCGC CGCGACCGAG 
GTGGAGGAGT ACCTGCTGGC CCTGCCCGGC GTGCGGGCGG CGGCGGTGGT CGGCGTGGCC 
GATCCCGTCC TGGGCGAGCG CTCGGTCGCC CTGCTGGTGG CCGACGGGCG GTGCCCGACC 
CGGGAGGAGG TGCGCGGCGT GATGCTGGAG CGCGGCGCGG CCGCCTTCAA GGTTCCCGAC 
GAGGTGCGCG CGGTGGCCGG TCTCCCCCTC ACCGGGGTGG GCAAGGTGGA CAAGGCGCGG 
CTGAGGCGGG AGTTGGCGGT TTCCTAG

Protein sequence

MPQDWLRWPR EQAREYRERG FWDDRKLDGL LRERADRHGE RTALVSGADR LTYAGLDGRV 
DRLAAGLASL GVEPGERVLL QLPNRREYVV TLFALLRIGA VPVLALPTLG AAEVESLVRT 
ARACAVVVAQ GRGRSDPRAA AARIARDVPS VRALVVVGDP GDTGGVRWDA LAEADPLPRG 
GDAGESGRHG RTPEVGAEDL ALLLLSGGTT GTPKLIPRTH ADYGYNARAS AEACGVGEDA 
VYLAVLPVAH NFTMVSPGIV GTLAVGGTVV LSPDPSPTTA FALIEREGVT ITSLVPALVP 
SWLDEAGRTG HDLSSLRVLQ VGGSRLDDTT ARRVGPALGC RLQQVFGMAE GLNNYTGLDD 
PDDLVCTTQG RPLSPADEVA VVDEAGDPVP PGTPGELLTR GPYTLRGYYR ARELDALRFT 
PDGFYRTGDL VTRSEGGDLV VVGRVKDQVN RAGEKIAATE VEEYLLALPG VRAAAVVGVA 
DPVLGERSVA LLVADGRCPT REEVRGVMLE RGAAAFKVPD EVRAVAGLPL TGVGKVDKAR 
LRRELAVS