Gene Noca_2030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2030
Symbol
ID	4598652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	2174177
End bp	2175616
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	68%
IMG OID	639776634
Product	integrase catalytic subunit
Protein accession	YP_923227
Protein GI	119716262
COG category	[L] Replication, recombination and repair
COG ID	[COG2826] Transposase and inactivated derivatives, IS30 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGACGA AGGACTGGAG CAAGAAGACC AGCGATGCGC CGGAGGGGCT TCGTCGGCAG 
TGGCGTGCTG ATCGGGCGCT GAGGCCGGCG ATGCGCTCGC CCGGGCGACC GGACCCGTCG 
CGGGTGGTGC AGCGACAGTT CTGGCGGCAG ATCGCCACGG GCGTCACGAC GGTGGAGGCG 
TCGATGGCCG TGGGCGTGTC GTGGCCGGTC GGTGCTCGCT GGTTTCGCCA CGCTGGCGGC 
ATGCCGCCGA TCTCGCTGGC CGAGCCCACC GGCCGCCACC TGACCTTCGA GGAACGCGAG 
GAGATCGCGA TCCTGCGCGC CAAGGACAAG GGCGTGCGCG AGATAGCCCG TGCGATCGGG 
CGTGACCCGG GGACCGTCTC ACGCGAACTT CGTCGCAATG CAGCGACTCG TGGCGGCAAG 
CAGGAGTACC GCGCTGGCGT AGCGCAGTGG AAGGCACAGC AGGCGGCGAA GCGTCCCAAG 
ACCGCGAAGC TCGTGACCAA CGAGCGGTTG CGTGAGTACG TGCAGGATCG GCTCGCCGGC 
AACGTCCGCC GTCCCGACGG CACGATCGTG CCGGGTCCGA CACCGCCGCC GTGGAAGGGC 
CTGAACAAGC CGCATCGCCG GGACAGGCGG TGGTCGACGG CTTGGAGCCC GGAGCAGATC 
GCCCAGCGCC TGAAGGTCGA GTTCCCCGAT GATGAGTCCA TGCGCATCAG CCACGAGGCG 
ATCTACCAGT CGCTGTTCAT CGAGGGCCGC GGTGCGCTCA AGCGCGAACT GGTCACCTGT 
CTGCGCACCG GGCGTGCGCT GCGGGAGCCG CGGGCCCGGT CACGGAACAA GGCACAGGGG 
CACGTGACCG CCGATGTCGT TCTCAGCGAG CGCCCCGCTG AGGCAGACGA CCGGGCCGTC 
CCTGGCCACT GGGAGGGCGA TCTGATCATC GGCACGGGTC GGTCTGCGAT CGGCACCCTC 
GTCGAGCGCA GCAGTCGCTC AACGCTCCTG GTCCATCTGC CGCGACTGGA GGGCTGGGGT 
GAGAAGCCGT ACGTCAAGAA CGGGCCATCA CTCGGTGGCT ACGGGGCCGT CGCGATGAAC 
ACCGCGCTGA CCGCGTCGAT GACCAAGCTG CCCGAGCAGC TGCGCAAGAC CCTGACGTGG 
GACCGTGGCA AGGAACTCTC GGGCCACGCG TTGTTCGCGG TGGCGACCGG CACGAAGGTG 
TTCTTCGCCG ACCCGCACTC GCCGTGGCAG CGACCGAGCA ACGAGAACAC CAACGGCCTG 
TTGCGCCAAT ACTTCCCCAA GGGCACCGAC CTGTCGCGCT GGTCCGCCGA GGACCTGGAG 
GCCGTCGCCT ATGCGCTCAA CAACCGGCCC CGCAAGGTCC TCGGGTGGAA GACACCCGCT 
GAGGTCTTCG AGGAGCAACT ACGCTCCCTT CAACAACCCG GTGTTGCATC GACCAGTTGA

Protein sequence

MATKDWSKKT SDAPEGLRRQ WRADRALRPA MRSPGRPDPS RVVQRQFWRQ IATGVTTVEA 
SMAVGVSWPV GARWFRHAGG MPPISLAEPT GRHLTFEERE EIAILRAKDK GVREIARAIG 
RDPGTVSREL RRNAATRGGK QEYRAGVAQW KAQQAAKRPK TAKLVTNERL REYVQDRLAG 
NVRRPDGTIV PGPTPPPWKG LNKPHRRDRR WSTAWSPEQI AQRLKVEFPD DESMRISHEA 
IYQSLFIEGR GALKRELVTC LRTGRALREP RARSRNKAQG HVTADVVLSE RPAEADDRAV 
PGHWEGDLII GTGRSAIGTL VERSSRSTLL VHLPRLEGWG EKPYVKNGPS LGGYGAVAMN 
TALTASMTKL PEQLRKTLTW DRGKELSGHA LFAVATGTKV FFADPHSPWQ RPSNENTNGL 
LRQYFPKGTD LSRWSAEDLE AVAYALNNRP RKVLGWKTPA EVFEEQLRSL QQPGVASTS