Gene Noca_2366 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2366
Symbol
ID	4595981
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	2521860
End bp	2523098
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	67%
IMG OID	639776965
Product	transposase IS116/IS110/IS902 family protein
Protein accession	YP_923558
Protein GI	119716593
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.587886
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGTGA TCCACGTCCG GTGTGCGGGC ATGGACGTGT CGAAGAAGGA CGCCAAGGTC 
TGCGTCCGAC ATGCGGGAGC AGGTCGGCGC AAGACCGTGG AAACGGTCAC GACCTGGACC 
TCAATGACCG GCCAGATCCT GGCGCTGCGC GAGCATCTGA TCGCCGAGCA GGTCACGTGT 
GTGGTGATGG AGGCAACCGG TGACTACTGG AAGCCGTTCT ACTACCTGCT CGAAGACCTG 
CCCGGTGTCG AGGTGATGCT GGTCAACGCC CGCCATGTCA AGACCCTGCC GGGACGCAAG 
AGCGACGTCG CCGACGCGAC CTGGCTGGCC CAGCTCGGTG CGCACGGCCT GGTCCGGGCC 
TCGTTCGTGC CACCCGAACC GATCCGGCAA CTGCGGGACC TGACCCGGGC ACGGACCGCG 
ATCACCCGCG AACGTGGCCG GGAGGTCCAA CGGCTGGAGA AGCTGCTGGA GGACGCCGGG 
ATCAAGCTGT CCGCGGTCGC CTCCGACATC ATGGGCGTCT CAGGACGGGC CATGCTCGAA 
GCGCTGATCG CCGGCGACCG CGATCCCGCC GGGCTTGCCG ACCTGGCCAG GCGTCGACTG 
CGGTCCAAGA TCCCTGAACT GACCGAAGCG CTCGCTGGCC GGTTCACCGA ACACCACGCG 
TTCCTCGCCC GGGTCCACCT GGATCTCATC GACCGACACA CCGCCGCCGT CGAGCAGTTG 
ACTGAGCGGA TCGAGGTGGT GATCGAGCCG TTTCAGGGCT TCCACGACCT GATCTGCACG 
ATCCCGGGAA TCTCCACGAT CACCGCCGAC ATCATCACCG CCGAGACCGG CGCGGACATG 
ACCCGGTTCC CCACTGCCAA GCACCTCGCC TCTTGGGCCG GGACCACACC CGGCAGCAAC 
GAGTCCGCCG GGAAGGTGAA GTCCTCACGG ACCAGGCCCG GGAACCCCTA CCTGCAGGGC 
GCACTCGGGG CGGCCGCGAT GGCGTGCTCA CAGAACCGGA CCACCTACCT CGGCGCGCGC 
TACCGGCGGA TCGCCAGCCG GCGCGGCCCG CTGAAGGCCA ACGTCGCGAT CCAGCACTCC 
ATGCTCATCG CGATCTGGCA CATGGGCACC ACCGGCACCC TCTACGACGA CCCTGGAGGC 
GAGTTCTTCA ACCGCCTCCA CCCCGACCGC ACCAAGATGC GAGCCATCAG CCAGCTCGAA 
GCCATGGGCT ACCGCGTCAC CCTCGACCAC GCGAGCTGA

Protein sequence

MEVIHVRCAG MDVSKKDAKV CVRHAGAGRR KTVETVTTWT SMTGQILALR EHLIAEQVTC 
VVMEATGDYW KPFYYLLEDL PGVEVMLVNA RHVKTLPGRK SDVADATWLA QLGAHGLVRA 
SFVPPEPIRQ LRDLTRARTA ITRERGREVQ RLEKLLEDAG IKLSAVASDI MGVSGRAMLE 
ALIAGDRDPA GLADLARRRL RSKIPELTEA LAGRFTEHHA FLARVHLDLI DRHTAAVEQL 
TERIEVVIEP FQGFHDLICT IPGISTITAD IITAETGADM TRFPTAKHLA SWAGTTPGSN 
ESAGKVKSSR TRPGNPYLQG ALGAAAMACS QNRTTYLGAR YRRIASRRGP LKANVAIQHS 
MLIAIWHMGT TGTLYDDPGG EFFNRLHPDR TKMRAISQLE AMGYRVTLDH AS