Gene Ndas_2704 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2704
Symbol
ID	9246555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	3225463
End bp	3226863
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	77%
IMG OID
Product	AMP-dependent synthetase and ligase
Protein accession	YP_003680625
Protein GI	297561651
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.431608
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGCTGG GTTCGGGCGC GGACGAGGGG ACCGCGGTGA GCGTCGGCGG GGCGGGGCTG 
GACCGCGAGG GGCTGTGGTC GGCCGCGGCC GCCGTGGCCG AGCGGGTCGC GGGGGCGGAC 
GCCGTCGCCG TGCACGGCGA GGCCTCGCTG TCCACGGTCG TCGCGGTGGT CGGCGGCCTG 
CTGGCCGGGG TGCCCGTGGT CCCGGTCCCG GCGGACTCGG GGACCGCCGA GCGCCGCCAC 
ATCGTGCGCG ACTCCGGCGC CGCGCTGTGG CTGGGCGCCC CGAGGGAGGA CGTGGACCTC 
CCCGTCGTCC CGGTGGACCC GGCCGAGCGC TCCTCGTTCG CGCTCCCCGA ACCGCCGCCC 
GAGTCCACCG CGCTGGTCAT GTACACCTCC GGGACCACCG GACCGCCCAA GGGCGCCCTC 
ATCCCGCGCC GGGCCGTGGC CGCCGACCTG GACGCGCTCG CCGACGCCTG GGACTGGACG 
CCCGACGACG TGCTGGTGCA CGGTCTGCCG CTGTTCCACG TGCACGGCCT GATCCTGGGC 
GTGCTGGGGG CCCTGCGCGT GGGCAGTCCG CTGCTGCACA CCGTCCGCCC CACCCCCGCC 
GCCTACGCGG CGGCGGCGCA GGGGACTCGG CGCGGAACCC TGTTCTTCGG CGTGCCGACG 
GTGTGGTCGC GGATCGCCCG CGACCCCGAC AGCGCACGCG CCCTGTCCGG GGCGCGGCTG 
CTGGTCTCGG GCAGCGCCCC GCTGCCCGAC ACGGTGGCCG ACGGCCTGCG GGGGGCGTGC 
GGCCACAGCC CCGTGGAGCG GTACGGGATG ACCGAGACGC TGATCACCGT GGCGGCGCGC 
GCCGACGCGC CCCGGCGCAC CGGCTGGGTC GGGACGGCGC TGCCGGGTCT GGAGACGCGG 
CTGCGCGGCG AGCACGGGGA GCCCGTCGCC TCCGACGGCG AGAGCGTCGG CGAGCTCCAG 
GTCCGCGGGG CCACCCTGTT CGGGGGCTAC CTCGGGCTGC CGGAGGCCAC GGCCGCGGCG 
TGGACCGGGG ACGGCTGGTT CCGCACCGGC GACGCGGCGG TCCGCGACGG GGACGGCTGG 
CACCGGATCG TGGGCCGGAT GTCGGTGGAC ATGATCAAGA CCGGCGGCTA CCGGGTCGGC 
GCGGGCGAGG TCGAGGCGGT GCTGCTCGGC CATCCCGGGG TGATGGAGGC CGCCGTGGTG 
GGCGAGGCCG ACGACGACCT CGGCCAGCGG ATCGTGGCCT ACCTGGTGGG CGAGGGCATC 
TCCCCCGAGG CGGTCATCGA CTTCGTGGCC GAGCGCCTGT CGGTGCACAA GCGCCCGCGC 
GAGGTGCGTG TGGTGGACAC GCTGCCGCGC AACGCGATGG GCAAGATCCA GAAGAAGCTG 
CTGGGCAACG CGTCCGCCTG A

Protein sequence

MLLGSGADEG TAVSVGGAGL DREGLWSAAA AVAERVAGAD AVAVHGEASL STVVAVVGGL 
LAGVPVVPVP ADSGTAERRH IVRDSGAALW LGAPREDVDL PVVPVDPAER SSFALPEPPP 
ESTALVMYTS GTTGPPKGAL IPRRAVAADL DALADAWDWT PDDVLVHGLP LFHVHGLILG 
VLGALRVGSP LLHTVRPTPA AYAAAAQGTR RGTLFFGVPT VWSRIARDPD SARALSGARL 
LVSGSAPLPD TVADGLRGAC GHSPVERYGM TETLITVAAR ADAPRRTGWV GTALPGLETR 
LRGEHGEPVA SDGESVGELQ VRGATLFGGY LGLPEATAAA WTGDGWFRTG DAAVRDGDGW 
HRIVGRMSVD MIKTGGYRVG AGEVEAVLLG HPGVMEAAVV GEADDDLGQR IVAYLVGEGI 
SPEAVIDFVA ERLSVHKRPR EVRVVDTLPR NAMGKIQKKL LGNASA