Gene Ndas_3365 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3365
Symbol
ID	9247230
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4021148
End bp	4022356
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	71%
IMG OID
Product	AMP-dependent synthetase and ligase
Protein accession	YP_003681276
Protein GI	297562302
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGCGGG AGAAGTACCT CCGCCACGTC TCCGGGGCCT CCGCGCCGGA GCTGTCCGAC 
CTCCCCACGC TCGACAGGGA CGAACTGGGC CGGGCGATCG ACACCCTGGT GCGCACCGAC 
CCGTCCGCCC TGACCCGCGC CTCCCTGAAC GTCATGGGGG GCACCCGGTC GACCATGCGC 
CTGGGGGCGG TCCCGGCGGA CCTGTACCTG GACGAGATCG CGCCGCACGT GCGCCCCTTC 
GAACAGGGCG ACCTGTTCAC CACCCTCGGC ACCCCGTTCC ACATGCGGGC CTGCCAGGAG 
CTGCACAACG GACTCGCCGC CAGGGCCGGA GTGCCCACAC TCTCCATGGA CGCGCCGACC 
GACCAGATGA TCGACGCCTA CCTCGACCTG TTCGAGCGCC ACGGGGTCAA CGCCCTGGGC 
ACCACCCTCG ACACCTTCCG GAGCCTGCTC CGTTACTGCG CCGCGTCCGG CCGGGACCTC 
GGGTTCCTGC GCAAGGTGCT GTGGAGCGGT CCGGCCATGG ACGCCGCCAC CCGAGCGCTG 
ATCCGGACAC ACTTTCCCCA CCTGCGCACA TGGGCGCTCT TCGGCTCGGC GGAGACCTGG 
ATCATCGGGC ACAGCGGCCC GGACTGCGCC AACGACACCC TCCACCCGCT CCCCCACCAG 
TACACGGAGA TCGTCGACGG GCGCATGCTG GTGACCGTCA CACACGAGAA GGCGGTCGTC 
CCGCTGCTGC GCTACGAGAC CGGGGTCGCG GCCGAATGGA CGGCCTGCCC CTGCGGCCTG 
CCCGGTCCCG CGGTGCGCAC CCACAGCCGC ATAGACGCCC CGATGGGGCC GCTCAGCCGC 
GTGGTCTCCC CCCTCGACCT CGTGCCGCTG GCCCTGCGGC TCGACTCGGT GGAGGCGGCC 
CAGGTCGTCC TGGTCGATCC CCACACCGAG GACGAACGGC TCCACCTGCG GGTCCGGCTG 
CGCCCGGAGA CCAGGTCCGA GCTCTACACC GGCGAGTGGA TCCGGCAGCA CGTGCTGTCC 
GAGTCGCTGG GGCTGTCCGA GGTGACGGAG GAGGCTCCGG AGTCCTTCGA GGTCATCGTC 
TCCCGGCACA TGCTGCGGGA ACTCCCGGAC GGGTCGGCCC CCGAGTTCCT GGTGCGCGAG 
GGGGGACGCC TCCGAATCCA ATCGATATCG AGTCAGGGTC AGGGTTCTTA TGGTACCTTC 
TCGGCATAG

Protein sequence

MLREKYLRHV SGASAPELSD LPTLDRDELG RAIDTLVRTD PSALTRASLN VMGGTRSTMR 
LGAVPADLYL DEIAPHVRPF EQGDLFTTLG TPFHMRACQE LHNGLAARAG VPTLSMDAPT 
DQMIDAYLDL FERHGVNALG TTLDTFRSLL RYCAASGRDL GFLRKVLWSG PAMDAATRAL 
IRTHFPHLRT WALFGSAETW IIGHSGPDCA NDTLHPLPHQ YTEIVDGRML VTVTHEKAVV 
PLLRYETGVA AEWTACPCGL PGPAVRTHSR IDAPMGPLSR VVSPLDLVPL ALRLDSVEAA 
QVVLVDPHTE DERLHLRVRL RPETRSELYT GEWIRQHVLS ESLGLSEVTE EAPESFEVIV 
SRHMLRELPD GSAPEFLVRE GGRLRIQSIS SQGQGSYGTF SA