Gene Sare_3794 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3794
Symbol
ID	5704543
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4321098
End bp	4322435
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	63%
IMG OID	641273214
Product	integrase family protein
Protein accession	YP_001538578
Protein GI	159039325
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0397442
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCGCC GCCGGTATCC CACCATTAGC AAAGGCAGTG ACGGGTGGTT TCATGCCTGG 
GTCACGGTGG GCACGAAGAG CAACGGGCGG CCCGATCAGC GGCACATCAA ACGGGCCACG 
GTAGAGCAGG TAGAGACACG GATAGACGAG CTACTAGAGC AGGCCCGCAC TGCTACGGTC 
CCGCGCGGCG GTCGCGGACC CACCGTTAAC ACCTGGCTGA TCAGTACCTA TCTGGAGACA 
ATCGCCCCCG GAAAGATTGA TCCAACGACC GTCCAGGGCT ACCGGAGTAA GGTCACAAAT 
TACGTTGTGC CAGTTATTGG TGCCCTTCGG ATGGATCGCG TAATAGCTGA TAACATCGAT 
GCCGTTTACA CAGAGATGCG GCGTCGAGGT CTCGCTGATG CCACGGTACT ACAGGTCCAC 
CGTATTCTTT CCCGCGCATG GAAAGTTGCC GCTCGGCGAC GTGTTGTGCC ACGAAACATC 
ATGCTCGATG TCGACCCGCC AAGTGCAAAG CGTCAAGAGA TGGAACCGCT CACGGAAGAC 
GAGGCTAAGG CGACGCTGGC GGCAGCCCAC CGACGCCGCA ACTCGGCCCG CTGGTCCGTC 
GGGTTCGCGG TTGGCACCCG CCAGGGTGAG GCGCTCGGCC TACGTTGGCC GCACCTCCTC 
GTAGAGTGCG ACGACTGCGG GGCAACGGTG AAGTTGGCGG ACTGGTGGGC CGGGCAACTG 
GTGCAGTGCC GAGGCTGCAA CTCGGTGAAT GTCGGCGCCG TCGCCCGGAT CTGGTGGCAG 
CTTCACCGGC GAGCGCACGA ACACGGCTGC GCTCCTCAGG CCCCATGGCC TTGTGGTCGA 
CGTCGTGGCG GCAACTGCCC AAACAAACGA CTGGTCCTGC GATCGGGCGA GATTCACGTC 
GGCGGCGGAC TGATTCTTAA GGAACCCAAG GGAAAGAGCA AGCGGACCAT TCCGATCCCG 
CAGGAACTTG TCGATAGCCT CCGAGCGCAC TACGAAGTGC AGAACTTGGA GCGAATGGTG 
GCTGAGGCTG CATACGCCTC GCATGGCTTC GTCTTCGCCG ACCAGCTCGG CGGCCCGATC 
GACCCAGCCG AAGACTGGCG GGAGTGGAAG ACCCTAATCG CGGATGCCGG CGTACGGGAC 
GCTCGGGTGC ATGACGGCCG GCATACTGCG GCAACGCTGC TTCTCGCTCA GGGAGTCGAC 
ATCCGGGTGG TCCAGGAGCT GCTTGGGCAC TCCTCGATCA AGGTCACCGA GGGATACACC 
CACGTCGCCT CGAAGCTGGC CCGGGACGCT ACGGAGCGTA TGGGAAAGCG GCTGTTCGGA 
ACGCCAGGTA CACCCTGA

Protein sequence

MPRRRYPTIS KGSDGWFHAW VTVGTKSNGR PDQRHIKRAT VEQVETRIDE LLEQARTATV 
PRGGRGPTVN TWLISTYLET IAPGKIDPTT VQGYRSKVTN YVVPVIGALR MDRVIADNID 
AVYTEMRRRG LADATVLQVH RILSRAWKVA ARRRVVPRNI MLDVDPPSAK RQEMEPLTED 
EAKATLAAAH RRRNSARWSV GFAVGTRQGE ALGLRWPHLL VECDDCGATV KLADWWAGQL 
VQCRGCNSVN VGAVARIWWQ LHRRAHEHGC APQAPWPCGR RRGGNCPNKR LVLRSGEIHV 
GGGLILKEPK GKSKRTIPIP QELVDSLRAH YEVQNLERMV AEAAYASHGF VFADQLGGPI 
DPAEDWREWK TLIADAGVRD ARVHDGRHTA ATLLLAQGVD IRVVQELLGH SSIKVTEGYT 
HVASKLARDA TERMGKRLFG TPGTP