Gene Noca_1100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_1100
Symbol
ID	4599580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	1159085
End bp	1160236
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	68%
IMG OID	639775696
Product	phage integrase family protein
Protein accession	YP_922303
Protein GI	119715338
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGGAA ACATCGCCAA GCGAGCCAAC GGCAAGTGGC GTGCGCGGTA CCGCGACGAG 
GCCGGCAACG AACGCGCCCG GCACTTCGAC CGCAAGATCG ACGCCCAGCA GTGGCTGGAT 
CAAGTCACCT CGGCGGTAGT CACCGGCACG TACGCCGACC CCAAGGCCGG CCGGATCACG 
TTCGCGGCCT TCTTCGGCGA GTGGTCGGCC CGCCAGGTCT GGGCACCCGG CACCGTGCTC 
GCGATGTCAC TGGCGGCGAG ATCCGTGCCC TTCGCGGGGA AGCCGATGAA GCAGGTCCGG 
CGCTCGGACG TCGAGACCTG GATCAAGCAG ATGAACGCCG CCGGACTCGC CCCCGGCACG 
ATCAAGACGC GCTACGTCAA CGTCAGATCA GTGTTCCGAG CCGCCGTGAA GGACCGGGTG 
ATCGGCTCCG ACCCGACCGA CGGCGTACGC CTTCCCCGCG GCCGTCGCGC GGACGTCGGC 
ATGTCGATCC CCGCGCCGGA GGAGGTGAGG CAGCTCATGG CCGTGGCTGA CGAACGCTTC 
CAGCCGTTCA TCGCCCTCTG CGCCTTCGCC GGGCTGCGGT TGGGTGAGGC CGCCGGGGTC 
CAGCTCGGCG ACGTCGACTT CCTCCGCAGG TCGCTGAAGG TCTCCCGCCA GGTGCAGCGC 
GTCAATGGTG GGGCGATTGA CGTACGGGCA CCGAAGTACG GCTCAGAGCG CGTCGTCTAC 
CTCGCCGACA GTCTCGTCAA CGTGCTCGCC GAGCACGTCG GCGCTCACGG CACCACCGGC 
AAGGCTCGGT GGCTCTTCGC CGGGGAGGGC GACGACCCAC CGCACCAGAA CACCATCGGC 
TACTGGTGGC GGAAGACGCT GCGCGACGCC GGCCTGTCCG GCATCAAACT CCACGACCTG 
CGGCACTTCT ACGCCTCCGG GCTCATCGCG GCCGGGTGCG ACGTTGTGAC CGTCCAACGA 
TCGCTCGGGC ACGCGAAAGC GACTACGACG CTCAACACCT ACGCACACCT CTGGCCGACC 
GCTGAGGACC GCACACGTAA GGCTGCGGAG TCGATCATGG CCGCGTCGCT GGGCAAGCCG 
GCCGCGATCC TCGCCGAGGT TGGAGGCGAG TACGGGTCAG TGAGCCATGC ATCTGATCGC 
AGATGTACTT GA

Protein sequence

MAGNIAKRAN GKWRARYRDE AGNERARHFD RKIDAQQWLD QVTSAVVTGT YADPKAGRIT 
FAAFFGEWSA RQVWAPGTVL AMSLAARSVP FAGKPMKQVR RSDVETWIKQ MNAAGLAPGT 
IKTRYVNVRS VFRAAVKDRV IGSDPTDGVR LPRGRRADVG MSIPAPEEVR QLMAVADERF 
QPFIALCAFA GLRLGEAAGV QLGDVDFLRR SLKVSRQVQR VNGGAIDVRA PKYGSERVVY 
LADSLVNVLA EHVGAHGTTG KARWLFAGEG DDPPHQNTIG YWWRKTLRDA GLSGIKLHDL 
RHFYASGLIA AGCDVVTVQR SLGHAKATTT LNTYAHLWPT AEDRTRKAAE SIMAASLGKP 
AAILAEVGGE YGSVSHASDR RCT