Gene Noca_3937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3937
Symbol
ID	4598072
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4144769
End bp	4146388
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	69%
IMG OID	639778542
Product	AMP-binding domain protein
Protein accession	YP_925121
Protein GI	119718156
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.104158
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGGCCT ACGCGAAGGG CGAGCTCGAG CCGCCCCTCC TCGAGGAGAC CATCGGCGCG 
AGCTTCGAGC GGACGGTGAC CGCGTACGCC GACCGCGAGG CGCTGGTCGA GGTGGCGAGC 
GGCCGGCGCT GGACCTGGGC CGAGCTGGAC CGCGACGTCG ACGACCTGGC GCGGGGGCTG 
GTGGCCGCCG GGATCGGCAA GGGCGACCGG GTCGGGATCT GGGCGCCCAA CTGCGCGGAG 
TGGACGGTCG TCCAGTACGC GACCGCCAAG CTCGGCATCA TCCTGGTCAA CGTCAACCCG 
GCGTACCGCA CGCACGAGTT CTCCTACGCG GTCAACCAGA GCGGCCTGCG GCTGCTGATC 
AGCGCGTCGA CGTTCAAGAC CAGTGACTAC CGCGCGATGG TCGAGGAGAC CGCGGCGCAG 
ACCCCGACCC TCGAACGGGT CGTCTACCTC GACACCGACG ACTGGGCGCA GCTCGTCGAC 
GCCGGCCGGA CGCTGCCCGA GGGCGTCGTC GCGGACCGGC TGGCGCAGAC CGCCCCCGAC 
GAGCCGATCA ACATCCAGTA CACGTCGGGC ACGACCGGCT ACCCCAAGGG CGCGACCCTG 
AGCCACCGCA ACATCCTCAA CAACGGCTAC TTCACCACCG AGCTGATCCA CCTCGGCCCC 
GAGGACCGGC TGTGCATCCC GGTGCCCTTC TACCACTGCT TCGGGATGGT GATGGGCAAC 
CTCGGGTGCA CCAGCCACGG CACCACGATG GTGATCCCCG CGCCGGGCTT CGACCCCGAG 
ATCACCCTGC GCACGATCGC CGCGGAGCGC TGCACCGGCG TGTACGGCGT GCCCACGATG 
TTCATCGCGA TGCAGAACCA CCCGACCTTC GCCGAGCACG ACCTCTCCAG CCTGCGCACC 
GGGATCATGG CCGGCTCGAT CTGCCCGGTC GAGGTGATGA AGCGCTGCGT CGATGACATG 
CACATGGCCG AGGTCGCGAT CGCCTACGGC ATGACCGAGA CCAGCCCGGT GTCCTGCCAG 
ACGCGTGCCG ACGACGACCT GGAGCGGCGT ACCGCCACCA TCGGGCGGGT GCACCCGTAC 
GTCGAGATCA AGATCGTCGA CCCGGTGAGC GGCGAGACCG TCGAGCGGGG GCGAACCGGT 
GAGTTCTGCA CCCGCGGCTA CTCGGTGATG CTCGGCTACT GGGACGATCC CGAGAAGACC 
GCCGAGGCGG TCGATGCCGA CGGCTGGATG CACACCGGCG ACCTCGCCGA GATGCGCGAG 
GACGGCTATT GCAACATCGT CGGACGGATC ACGGACATGG TGATCCGGGG CGGGGAGAAC 
ATCTACCCGC GTGAGATCGA GGAGTTCCTC TACCAGCACC CCGACATCGA GGACGTGCAG 
GTGATCGGCG TCCCGGACGA GCGGTACGGC GAGGAGCTGT GCGCCTGGGT GCGGATGCGT 
GCCGGGGCCG AGCCGCTCGA CGCGGACGCC GTGCGCGCGT TCGCCACCGG ACGGCTCTCG 
CACTACAAGA TCCCCCGCTA CGTCCTGGTG GTGGACGAGT TCCCGATGAC GGTGACCGGC 
AAGATCCGCA AGGTGCAGAT GCGTGAGGAG AGCGCGAAGC GACTCGGCCT CCGTGCGTGA

Protein sequence

MEAYAKGELE PPLLEETIGA SFERTVTAYA DREALVEVAS GRRWTWAELD RDVDDLARGL 
VAAGIGKGDR VGIWAPNCAE WTVVQYATAK LGIILVNVNP AYRTHEFSYA VNQSGLRLLI 
SASTFKTSDY RAMVEETAAQ TPTLERVVYL DTDDWAQLVD AGRTLPEGVV ADRLAQTAPD 
EPINIQYTSG TTGYPKGATL SHRNILNNGY FTTELIHLGP EDRLCIPVPF YHCFGMVMGN 
LGCTSHGTTM VIPAPGFDPE ITLRTIAAER CTGVYGVPTM FIAMQNHPTF AEHDLSSLRT 
GIMAGSICPV EVMKRCVDDM HMAEVAIAYG MTETSPVSCQ TRADDDLERR TATIGRVHPY 
VEIKIVDPVS GETVERGRTG EFCTRGYSVM LGYWDDPEKT AEAVDADGWM HTGDLAEMRE 
DGYCNIVGRI TDMVIRGGEN IYPREIEEFL YQHPDIEDVQ VIGVPDERYG EELCAWVRMR 
AGAEPLDADA VRAFATGRLS HYKIPRYVLV VDEFPMTVTG KIRKVQMREE SAKRLGLRA