Gene Noca_3702 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3702
Symbol
ID	4597619
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	3928870
End bp	3930000
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	72%
IMG OID	639778310
Product	carboxylate-amine ligase
Protein accession	YP_924889
Protein GI	119717924
COG category	[S] Function unknown
COG ID	[COG2170] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02050] uncharacterized enzyme

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0961224
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGATCG ACTTCCACGC CTCACCCGAG CCCACGCTCG GCGTGGAGTG GGAGTTCGCG 
CTCGTCGACC GGCGCACCCG TGACCTGCGC AACGACGCCA CCCACCTGTT CGCTCGGGCC 
AAGCCCCGGT TGCCCGACCC CGACAAGCTG CACAAGGAGC TGCTGCGCAA CACCGTCGAG 
GTCGTGAGCG GGGTGTGCCA CACCGTCGGC GAGGCGATGG CCGACCTGCG CCGGACCCTC 
GAGGTGGTGG TCCCGGCGGG TGACGACCTG GACCTGGACC TGTACGGCGG CGGCACCCAC 
CCGTTCGCGT CCTGGACCGT GCAGCAGCTC TCCGAGGGGC ACCGCTACGA GGAGCTGATC 
AACCGCACCC AGTGGTGGGG CCGGCAGATG CTGATCTGGG GCGTGCACGT GCACGTCGGG 
ATGCCCGAGC GCGACCGGGT GATGGCGGTG CTGTCGTCGC TGCTCAACTT CCACCCCCAC 
CTGCAGGCGC TGTCCGCCTC CTCGCCGATC TGGTCCGGCA TCGACACCGG CTACGCCTCC 
AACCGGGCGC TGATGTTCCA GCAGTTGCCG ACCGCGGGCC TGCCGTTCCA GTTCGAGCGC 
TGGTCGGAGT TCGAGGCGTT CGTCGGCGAC GAGCTGGTGA CCGGCGTGAT CGAGGAGCTC 
TCGGAGGTGC GCTGGGACGT CCGGCCCGCA CCGCGCATCG GCACCCTCGA GAACCGGATC 
TGCGACGGCG TCCCCGACCT CGCCGACCTG TCCTCGCTGG TCGCGCTCAT GCACTGCCTG 
GTCGTCGACC TCGACACCCG GGCCGCGGCA GGCGAGACGC TGCCGACGAT GCCGCCCTGG 
CACGTCCAGG AGAACAAGTG GCGCGCGGCC CGCTACGGCC TGGACGCGAT CGTGATCACC 
GACGCCGAGT CCAACGAGCG GCTGGTCACC GAGGACCTGG CCGACCACCT GGAGCGGCTC 
GCGCCGGTCG CCGACCGGCT CGGCTGCAGC GAGGAGCTCG CCCAGGTGGC GCAGATCCCG 
GTGCGCGGCG CGTCGTACCA GCGCCAGCGC GCGGTCGCCG AGCGCACCGG CGGCGACCTG 
GTCGCCGTGG TCGACTCGGT CGTCCGCGAG CTGCGCGCCG GCCTGGGCTG A

Protein sequence

MRIDFHASPE PTLGVEWEFA LVDRRTRDLR NDATHLFARA KPRLPDPDKL HKELLRNTVE 
VVSGVCHTVG EAMADLRRTL EVVVPAGDDL DLDLYGGGTH PFASWTVQQL SEGHRYEELI 
NRTQWWGRQM LIWGVHVHVG MPERDRVMAV LSSLLNFHPH LQALSASSPI WSGIDTGYAS 
NRALMFQQLP TAGLPFQFER WSEFEAFVGD ELVTGVIEEL SEVRWDVRPA PRIGTLENRI 
CDGVPDLADL SSLVALMHCL VVDLDTRAAA GETLPTMPPW HVQENKWRAA RYGLDAIVIT 
DAESNERLVT EDLADHLERL APVADRLGCS EELAQVAQIP VRGASYQRQR AVAERTGGDL 
VAVVDSVVRE LRAGLG