Gene Saro_1457 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1457
Symbol
ID	3916122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1500172
End bp	1501404
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	65%
IMG OID	640444200
Product	integrase
Protein accession	YP_496734
Protein GI	87199477
COG category	[L] Replication, recombination and repair
COG ID	[COG4584] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGATAC TGGAGTTGCA TCGGCAGGGG CTGTCGGTGA CGGCGATCGC GCGCCGAACC 
GGGCGCGATC CCAAGACCGT GCGCAAATAC ATCGAGCGGG GCGTTGAGGT GCCGGCTTAC 
GGTCCGCGTG TGGCGGGCCG GCCGAGCAAG ATCGCGCCCT ACATGGATTT CCTGCGCGAA 
CGGGTGACGA CATTCCCCGA CCTGACCGCC TCGCGACTGA CCCGCGAGAT CAGGGAGATG 
GGCTACGCCG GCGCCTACAC GGCGGTGAAG CGCTATCTGG CGGCGATCCG GCCCGAGCAT 
CCCAAGCCCT ACGAGGTTCG CTTCGAGACC AAGGCGGGCG TGCAGGGTCA GGTCGACTTC 
GCCCGCTTCG TAGTGGAGTT CACCGATGAG CCCGGTGTGG CGCGCATCGT CTGGCTGTTC 
AGCATGGTGC TGGGCTACTC GCGCCTCCTG TTTGCCCGCT ATGTGCTCCA CCAGGATCTG 
CAGACGCTGC TGCGCTGCCA TATGCAGGCC TTCGAGGCCC TGGATGGTGT GCCGATCGAG 
ATTCTCTACG ACCGGATGAA GACCGCGGTG ACCGGCGAGG ACGACCAGGG TCACATCGTC 
TACAATACCT CGCTGCTGGC TCTGGCGAAG CACTACCGGT TCCAGCCCAG GGCCTGCCGG 
CCCTATCGCG CCAAAACGAA GGGAAAGGTC GAGCGACCCT TCCGCTACAT CCGCGAGGAC 
TTCTTCCTGG GGCGATCCTT CCGCAACATG GAGGATCTCA ACGCCCAACT CATCGACTGG 
CTCGACACGG TCGCCAATGT ACGGGTGCAT GGCACGACCC AACGCGTGGT GACCGAGGCC 
TTCGCCGAGG AGCAGGAAGA GCTGCAGCGC TTGCCCGAGC ACCGCTTCAA CGCCGTCCTG 
AAGCTCGAGC GGCGGGTCAG CCATGACGGG CTCGTGGCGG TCGGCGGCAA CTATTACAGC 
GTGCCCGACC GAACGCGCCG GGTCGTCGAG ATCGAGCAAC TGCCGGATCT GATCCGTGTC 
ATCGACCGCG GCATCGTTGT TGCCGAACAC CCGGTGCTGG AAGGGCGTCG ACAATATCGC 
ATCGATCAGC GTCATCGCAC CGGACGACCT CAGCCGAGAA TGCATGAGCG GCCGGTGACG 
ACGATCGGCC GCATCGGTGA CTATGTGCCA CTGCGCTCGC TGGCCATCTA TGAAGCGATC 
GGCGCGGGCC TTGCCACGGA GGGTCGGCCA TGA

Protein sequence

MMILELHRQG LSVTAIARRT GRDPKTVRKY IERGVEVPAY GPRVAGRPSK IAPYMDFLRE 
RVTTFPDLTA SRLTREIREM GYAGAYTAVK RYLAAIRPEH PKPYEVRFET KAGVQGQVDF 
ARFVVEFTDE PGVARIVWLF SMVLGYSRLL FARYVLHQDL QTLLRCHMQA FEALDGVPIE 
ILYDRMKTAV TGEDDQGHIV YNTSLLALAK HYRFQPRACR PYRAKTKGKV ERPFRYIRED 
FFLGRSFRNM EDLNAQLIDW LDTVANVRVH GTTQRVVTEA FAEEQEELQR LPEHRFNAVL 
KLERRVSHDG LVAVGGNYYS VPDRTRRVVE IEQLPDLIRV IDRGIVVAEH PVLEGRRQYR 
IDQRHRTGRP QPRMHERPVT TIGRIGDYVP LRSLAIYEAI GAGLATEGRP