Gene Arth_4520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4520
Symbol
ID	4443341
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008537
Strand	+
Start bp	142683
End bp	143885
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	62%
IMG OID	639687573
Product	phage integrase family protein
Protein accession	YP_829270
Protein GI	116662215
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.167996
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCTCT CGGATCGCAG TTGGGATAGG CATCGAGCGG AGGGACTGAC TGTCGCGAAC 
GTCGGGCGGG TGATTCCTCG CTCCAGTGTT CCTGGGTTCG TGGTCCTCGA CGCGATGGGC 
GAGGAGTTCG CTCCTGCCAC GGAGTATCTG CTTGAGCTGG CAGCGTCGGA CCGTTCGCCT 
CAGACGGTAC GAACTTATGC CTTGTCGTTG CTTCGGTTCC TTCGCTTTTT GTGGGCTGTC 
GGGGTCAGCT GGGAGCAGGC AACGTCCCTT GAAGCGCGTG ACTTCGTGTT GTGGGCGCGC 
CAGGCCGAGA AGTTCGTCGG GAATCGTAAC GTCCCGCAGC GGCGGGGGAG CCGGAACCTT 
GTCACGGGAA AGAAGCATCT AGGAATGCGT TACTCACCCT CGACGATCAA CCACACGACG 
ACGGTGTGTA AGGAGTTTTA CGCTTTCCAG CTTCGGATGG GTGACGGGCC CATCGTGAAT 
CCTTTCGAGC TGCGCCGTGG GCGATCCCAT GCGCATCATG ATCCTCAGCG GGAGTTTGCC 
CCGGTGCGGC GCCAGCCCTT GCGTCAGCGC GAGGCGCACC GGGTGCCCAG ATCAATCCCG 
GACGGAAAGT TCAACGATCT GTTTCGCCGT TTGCGGTCCA ACAGGGACCG GGCGTTGGTG 
GCGTTTTATG TCAGCAGCGG TGCACGGGCG AGCGAGCTGC TCGGGCTCAC GGGTGACCGG 
GTCAACGTGG GTGACCAGCT GATCGGCGTT TACCGCAAAG GTGGCCAGCT GCAATGGTTG 
CCCGCGGCGC CTGATGCTTT CGTATGGCTT CGGCTCTATC AGCTCGAAGG AGGCGTTGCC 
GGCCCGGATG AACCGGTTTG GCTCACGCTG CGGGGCGAGC CCCGTCCTCT GACCTACGAA 
GCCATGCGCG CCGTACTGAG ACGCTGCAAC GACCTGCTCG GTTCGAACTG GACGCTGCAC 
GATCTGCGGC ACACGTTCGC GATCCGAGCG CTCGAGGGCG GGATGGGCCT TCACGAAGTC 
CAGGAGTTAC TGGGTCACCA ATCGCGGACT ACGACCACGG TCTATGCGGT TCCGCATATG 
GAGGAAGTCA TCGAGCACTA CCGGACCCAT CTGAGCAGCA GGACTTCCCC TGCCATTGAC 
AGTTCACCGG CCGGCCAGCC CTATAACCCC GACGAGTTGC GCGTGCTTTG GGGGAACCAG 
TGA

Protein sequence

MDLSDRSWDR HRAEGLTVAN VGRVIPRSSV PGFVVLDAMG EEFAPATEYL LELAASDRSP 
QTVRTYALSL LRFLRFLWAV GVSWEQATSL EARDFVLWAR QAEKFVGNRN VPQRRGSRNL 
VTGKKHLGMR YSPSTINHTT TVCKEFYAFQ LRMGDGPIVN PFELRRGRSH AHHDPQREFA 
PVRRQPLRQR EAHRVPRSIP DGKFNDLFRR LRSNRDRALV AFYVSSGARA SELLGLTGDR 
VNVGDQLIGV YRKGGQLQWL PAAPDAFVWL RLYQLEGGVA GPDEPVWLTL RGEPRPLTYE 
AMRAVLRRCN DLLGSNWTLH DLRHTFAIRA LEGGMGLHEV QELLGHQSRT TTTVYAVPHM 
EEVIEHYRTH LSSRTSPAID SSPAGQPYNP DELRVLWGNQ