Gene Sare_1208 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1208
Symbol
ID	5703992
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1357773
End bp	1358864
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	72%
IMG OID	641270726
Product	integrase family protein
Protein accession	YP_001536107
Protein GI	159036854
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACCGGG GTGGGGCGAC CCGTGCCCTG CACGCGGCAC TTCCCCCGCC GCTGCGGGAG 
GCGGTTGACG ACTTCGCGAA CCACCTGTCC CAGGTCCACA ATCGGTCAGC CCACACCGTC 
CGGGCCTACG TCACGGATGT GGTTCACCTG CTCGACCACG CCGTACGGGC CGGGATCCGT 
ACCCCCTCCG ACCTCACGCT GGCACAGGTA CGCAGTTGGC TGGCCCGACA GCGAACGACG 
GGAGCGGCCA GGTCCACCCT CGCCCGACGG GCCGCCGCAG CCCGTACCTT CAGTGCCTGG 
GCGCACCGGT GCGGCTGGAT ACCGACAGAT GTGGCCGCAC CACTGGCAAG TCCGCGAGCC 
CAGCGGGAGC TACCCGCCGT ACTTCCGGTC CACCAGGCCG CCGCCCTGCT GGAGACCGCG 
CACCACGCGG GACGCGGTCG GTCGAGGCAG AAGCAACCAC CGACGTCCGA TGCGCGACCA 
GCCAGCGCGG CGGATACGAT GCCCGGCTCC CACAGCAGCC GCCACCAGAC TGGCGAGAAC 
CGCACCGGCG GAGCCGGGCA ACACGGCGTC CCGTCCGACG CCAACGACCC GGTTCAGCTA 
CGGGACTTGC TGCTACTGGA ACTCCTGTAC GCGACGGGGG TCCGGGTCAG TGAGGCGTGC 
GGGCTGGACA TCGCGGACGT GGACCCGGGC CGGCGGGTGC TGCGGGTACT CGGCAAGGGA 
AACCGGGAAC GCACCGTGCC GTACGGTGTC CCGGCGCAGC GAGCACTCGA CGCGTGGCTG 
CGCCACGGCC GTCCCTGGCT GGCCGGGCCC CGGTCGGCGA ACGCGCTGCT GCTCGGGGCC 
CGAGGAGGTC GACTCAACCC GACCACTGCG CGGGGAGTCG TCGCCCGCTG CGCGGCAGCC 
GCCGGCCTGC CCCCGACCAC CCCGCACGGG CTACGGCACG CGACAGCCAC CCATCTGTTG 
GAAGGTGGCG CGGACCTGCG GACGGTACAG GAGCTGCTCG GGCACACATC GCTGGCCAGT 
ACCCAGATCT ACACCCACGT GTCGGTCGAG CGGCTGCGGG CCGCGTACCG ACAGGCCCAC 
CCGCGCGCGT GA

Protein sequence

MNRGGATRAL HAALPPPLRE AVDDFANHLS QVHNRSAHTV RAYVTDVVHL LDHAVRAGIR 
TPSDLTLAQV RSWLARQRTT GAARSTLARR AAAARTFSAW AHRCGWIPTD VAAPLASPRA 
QRELPAVLPV HQAAALLETA HHAGRGRSRQ KQPPTSDARP ASAADTMPGS HSSRHQTGEN 
RTGGAGQHGV PSDANDPVQL RDLLLLELLY ATGVRVSEAC GLDIADVDPG RRVLRVLGKG 
NRERTVPYGV PAQRALDAWL RHGRPWLAGP RSANALLLGA RGGRLNPTTA RGVVARCAAA 
AGLPPTTPHG LRHATATHLL EGGADLRTVQ ELLGHTSLAS TQIYTHVSVE RLRAAYRQAH 
PRA