Gene Saro_3970 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3970
Symbol
ID	5077500
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009426
Strand	-
Start bp	138836
End bp	140002
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	62%
IMG OID	640481076
Product	phage integrase family protein
Protein accession	YP_001165738
Protein GI	146275577
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGGCG GTCGCCGGTC GTGGACGGTA TTGGATGATG ACGGCGATGT CGTCGAGTGC 
CTTCGTCACT GGATCGTCCA TCTCGAACAG ACCCATGCGT CACCAAACAC GATCCGCGCT 
TATGTTCGCC ACGTTGTGGA CTTCGCTAGC TTCCTCGGCG CAAACGGCGC CGGCATCCAT 
GAAGCCACGG TTGCGCTGTA TGACAGCTTC CTTGCCTGGC GGCTTGCCCG CCGAAAGGAT 
GCGCTGCCAA GTCCTCGGCT GATCCTGCTA CGCAAGCAGG AAACGCGGAT TCTGGCACCA 
TCGACGCGCA ACCAGATCCA GCTCGCGGTC AAATCGTTCT ACCGCTTTTA CAACGGCACT 
GACGACTTCG CGGTCGATAC GACCGAGGTC ACAAAGGCCT ATGACGGCCA CCGGATCTAC 
AAGCCGTTCC TTGAGCATAT CAGCCAGCGA CGGACGACAC GGCGCAAAGA CCGTTATCTC 
TCGGGCGATC CCGGCCGGGT CCAGCAGCAG GTGCTCAAGA AGCGGCTGAC GCCGAGCGAG 
GTTCTGCGGC TGATCGAGGC CTGCGGGCTC GCGCGCGACG CCTTCCTGGT CGTGCTGCTC 
TACAACACCG GCCTTAGGAT CGGTGAAGCG CTGGGCCTGC GCCATGTCGA TATCGATCTC 
GCCGAAAAGG TCATCTGGGT CGTTCCGCGC GAAGACAATG CCAATGAGGC CCGTGCGAAA 
TCGGGCCGGA CGCGCGGTGT GCCGGTGCAC GACTACGTGC TCAACATGTA CGTCGATTAC 
ATCACCAGCG ACGAATATCT GCCAGCCTTC GAGTCCGGCG CCGAGTACGT CTTCACCAAT 
GTCAAAGCCG GCGTCATCGG GCACGCCATG AGCCTGTCCT ACGCGCAGAA GCTCGCGGGC 
CTGCTGGAGC AGCGCACCCA TATCGCCTTC AGCTGGCACA TGTTCCGCCA CAGCCATGCA 
TCCGAGGCGA TCGCGGCGGG ATACAGCCTG CTCGAAGTGG CCGACCGGCT CGGGCATGCC 
AGCCCGCAAA CGACAGCGGC GTTCTATCAG CACCTGTTCG CCTCGGAAAT CCGCAGGCTT 
TACCTCACAG GACCCGACGA GGTGCATGAA AGGCTTGAGA AACTTCGCGA GGCTGAGCTG 
CTCGGAAAGG ATCTGCGATG GGCCTGA

Protein sequence

MPGGRRSWTV LDDDGDVVEC LRHWIVHLEQ THASPNTIRA YVRHVVDFAS FLGANGAGIH 
EATVALYDSF LAWRLARRKD ALPSPRLILL RKQETRILAP STRNQIQLAV KSFYRFYNGT 
DDFAVDTTEV TKAYDGHRIY KPFLEHISQR RTTRRKDRYL SGDPGRVQQQ VLKKRLTPSE 
VLRLIEACGL ARDAFLVVLL YNTGLRIGEA LGLRHVDIDL AEKVIWVVPR EDNANEARAK 
SGRTRGVPVH DYVLNMYVDY ITSDEYLPAF ESGAEYVFTN VKAGVIGHAM SLSYAQKLAG 
LLEQRTHIAF SWHMFRHSHA SEAIAAGYSL LEVADRLGHA SPQTTAAFYQ HLFASEIRRL 
YLTGPDEVHE RLEKLREAEL LGKDLRWA