Gene Arth_2200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2200
Symbol
ID	4445261
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2478569
End bp	2479675
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	63%
IMG OID	639690009
Product	phage integrase family protein
Protein accession	YP_831680
Protein GI	116670747
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.343714
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGTCG ACGGGTCCGG GCGTGTGCTG CAGCTGAGCG CTGTTCAGCT GCTGCATCCC 
GAGGAACAGA CGCTCGAAGA CATGCTGACC GGCTGGCGCA ACCAGCAGCT CTCCAGGAAC 
CTCCAGTTCG ACACAGTCGA CAAGGGCATC GAGTGCGTCC GCCGGTTCGT CAACCATGTG 
AACGAGTTCC CGTGGAACTG GGCACCGGAG CAAGTCGAGG AGTATTTCGG TGACCTCCGC 
TCGATCCACC AGCTGAAGCA CTCCACTATC CGCGGCTACC AGTCCACGCT CCGCCGGTTC 
ACGTCCTACG TGTCGAACCC CGACTACGGC TGGGACCAGG TCTGCGAACA ACGCTTCGGC 
ACACACCCCT CCCAGGTCTT CTTTGACTGG AACACCGCCA CCCACACGCA GGAGTACGAA 
GGACGCGCCT CCAAGCGGCC CTTCACCAAG ACCGAACTGC AGATGCTGTT CGATCACGCC 
GACGACCAGG TCGAACTCAT CGCCGCCTCA GGCAAGAAAG GCTGGCAGGC AGCCTACCGG 
GACGCCGTCA TGCTGAAAGT CGCCTACTCG TACGGGCTCA GATTCAACGA GCTCCGGCAC 
CTGCAAACCA TCGACTTTGC GGCCAACCCC CAAGCACGAA GGTTCGGCAA GGCAGGCGTC 
TGCAAGGTCC GGTTCGGCAA ATCACGCAAG GGCTCCCCCC ACAAACCCCG CAGCGTCCTG 
ACGGTCTTCG ACTGGACCGC CGGAGTCATC GAGGACTGGC TCGCCAACGG ACGAGGCACA 
CTCGACACCT TGGACCTGTT CCCCAGCGAA CGCGGCGGCC TGATCTGTGA ATCCACCCTG 
CTGCGCCGGC TCCGGCGCTA CCTCAACGAG CTGGGCCTGC CAATGGATGG CCTGGACCTG 
CATTCGCTCC GGCGCTCCTA TGCAACGCAC CTGCTCGAGG ACGGATGGGA TCCTAGATTC 
GTGCAACATC AAATGGGCCA CGAACACGCC TCCACCACCG GGATCTACCA GTTCGTCAGC 
GACGACTTCC GCAACACGAC CCTCCGGGCG GCCCTGGACC GCACCATGGA CGAAGTCCTG 
GGCGTGCAGA TGCGAGGTCA ATGGTGA

Protein sequence

MAVDGSGRVL QLSAVQLLHP EEQTLEDMLT GWRNQQLSRN LQFDTVDKGI ECVRRFVNHV 
NEFPWNWAPE QVEEYFGDLR SIHQLKHSTI RGYQSTLRRF TSYVSNPDYG WDQVCEQRFG 
THPSQVFFDW NTATHTQEYE GRASKRPFTK TELQMLFDHA DDQVELIAAS GKKGWQAAYR 
DAVMLKVAYS YGLRFNELRH LQTIDFAANP QARRFGKAGV CKVRFGKSRK GSPHKPRSVL 
TVFDWTAGVI EDWLANGRGT LDTLDLFPSE RGGLICESTL LRRLRRYLNE LGLPMDGLDL 
HSLRRSYATH LLEDGWDPRF VQHQMGHEHA STTGIYQFVS DDFRNTTLRA ALDRTMDEVL 
GVQMRGQW