Gene Saro_2793 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2793
Symbol
ID	3916953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3015091
End bp	3017376
Gene Length	2286 bp
Protein Length	761 aa
Translation table	11
GC content	65%
IMG OID	640445572
Product	DNA topoisomerase IV subunit A
Protein accession	YP_498063
Protein GI	87200806
COG category	[L] Replication, recombination and repair
COG ID	[COG0188] Type IIA topoisomerase (DNA gyrase/topo II, topoisomerase IV), A subunit
TIGRFAM ID	[TIGR01062] DNA topoisomerase IV, A subunit, proteobacterial

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGACCG ATACGACAGA ACCCGATCCG TTCGACGCAA TCGTCGATGC TCCGTTCGAT 
TCCGCGCTGT CGGAACGCTA CCTCGTCTAT GCGCTGTCGA CGATCACCGC GCGCTCGCTG 
CCCGACCTGC GCGACGGTCT GAAGCCGGTG CACCGCCGCC TGCTGTGGGC GATGCGGCAA 
CTGAAGCTGG ATCCGGCGCA GGCGTTCAAG AAATCGGCCC GCGTGGTCGG CGACGTCATC 
GGCAAGTATC ACCCCCATGG CGATGCCAGC GTCTATGACG CGATGGTCCG CCTCGCGCAG 
GACTGGGCGC TGCGCTATCC GCTGGTCGAG GGGCAGGGCA ACTTCGGCAA CATCGACGGC 
GATAACGCCG CGGCCTATCG CTATACCGAA GCCAGGCTGA CGAAGACGGC GATCCAGCTC 
ATGTCCGGGC TGGACGAGGG CACCGTCGAC TTCGTGCCCA CCTACAACGG CGAGGAGGAA 
GAGCCGGAAA TCTTTCCGGG CCTGTTCCCG AACCTGCTGG CCAATGGATC GAGCGGCATC 
GCGGTGGGCA TGGCCACCAA CATCCCGAGC CACAACGTGG CCGAGATCAT CGATGCGACG 
CTGCTGCTGA TCGACAATCC GCATGCCGAG CACGCCCAGT TGATGGAAGT GTTCCACGGG 
CCCGACCTGC CGACGGGCGG CGTCATCGTC GACAGTCCGG CGGTGATTTC CAACGCCTAT 
GAAACCGGAC GCGGCGCGAT CCGGGTGCGC GGGCGCTTTT CGACGGGCCG CGACGAGGCT 
GGCAACTGGG AAGAGAGCGG CATCGAGAAG CTGGGCGGCG GGCAGTGGCA GCTCGTGGTC 
TCGGAAATCC CCTACATGGT GCAGAAGGGC AAGCTGATCG AGCAGATTGC CCAGCTCATC 
GCCGACAAGA AGCTGCCGAT CCTCGAGGAC ATCCGCGACG AGAGCGACGA GCAGATCCGG 
CTGGTGCTGA TCCCCAAGAG CCGAAATGTC GACCCCGACC TGCTCAAGGA ATCGCTCTAC 
CGACTGACCG ACCTTGAAAC GCGGTTCGGG CTCAACCTCA ACGTGCTGGA TTCGCGGCGG 
ACGCCCGGCG TGCTGGGGCT GAAGCTGGTA TTGCAGGAGT GGGTGATCTC GCAGATCGAC 
ATCCTGCTGC GGCGTTCGCG CCATCGGCTG GACAAGATCG CCTCGCGGCT CGAGCTGCTC 
GAAGGCTATA TCATTGCCTA TCTCAACCTC GACCGGATCA TCGAGATCAT CCGCACCGAG 
GACGAGCCCA AGCCGGTGAT GATGGCCGAG TTCGAGCTGA CCGACCGCCA GGCCGAGGCG 
ATCCTCAACA TGCGGCTGCG ATCCCTGCGC AAGCTCGAGG AAATGGAGCT GCGCAAGGAA 
CGCGATGCCC TGCTGGCAGA GCAAGAGGAG CTGCAGAAGC TGCTCGACAG TCCGGCGCGC 
CAGCGCACCC GGCTGAAGCG CGACCTGGCG GCGCTGCGCA AGGACTATGC CGAGGACACC 
GCGCTGGGAC GGCGGCGCAC GACGATTGCC GAAGCCGCGC CGACGCGCGA GTTCAGCATG 
GACGCGATGA TCGAGAAGGA GCCGGTGACG GTGATCCTTT CGGCCAAGGG CTGGATCAGG 
GCGGCCAAGG GGCATGTGCC GCTCGATGGC GATTTCAAGT TCAAGGAAGG CGATGGCCCG 
GCCTTCGCAC TTCACTGCCA GACCACGGAC AAGCTGCTGG TGGCGGTGGA CAACGGGCGG 
TTCTACACGC TGGGGGCCGA CAAGCTGCCG GGCGCGCGGG GCTTTGGCGA GCCTATCAGG 
ACGATGGTGG ACATCGATCC GGATGCGCAG ATCGTTTCGG TCCTGCCCTA CAAGCCCAAG 
GGGCAACTGC TGCTCGCGGC GAACACCGGG CGCGGCTTTG CCGCCGAGAT GGACGAACTG 
CTGGCCGAGA CGCGAAAGGG GCGCGGGGTG GTTTCAACCA AGCCGGGCGT CAAGCTTGCC 
GTGGTGCGCG AGATCGCGCC CGAGCACGAT CACGTCGCGG TGATCGGCGA GAACCGCAAG 
CTGGTGATCT TCGCGCTTTC GGAAGTGCCG CTGCTCGCCA AGGGGCAGGG CGTCACGCTG 
CAGCGCTACA AGGACGGCGA GATGTCGGAC GTGATCACGC TGCGGCTCGA AGATGGGCTT 
ACCTGGGCGA TGGGCGGCGA GAGCGGACGG ACGCGGGTGG AGAAGGATCT GCTGCCGTGG 
AAGGTTGCGC GCGGCGCCGC GGGGCGCCTG CCGCCGAACG GGTTTCCGCG AGATAACCGG 
TTCTGA

Protein sequence

MATDTTEPDP FDAIVDAPFD SALSERYLVY ALSTITARSL PDLRDGLKPV HRRLLWAMRQ 
LKLDPAQAFK KSARVVGDVI GKYHPHGDAS VYDAMVRLAQ DWALRYPLVE GQGNFGNIDG 
DNAAAYRYTE ARLTKTAIQL MSGLDEGTVD FVPTYNGEEE EPEIFPGLFP NLLANGSSGI 
AVGMATNIPS HNVAEIIDAT LLLIDNPHAE HAQLMEVFHG PDLPTGGVIV DSPAVISNAY 
ETGRGAIRVR GRFSTGRDEA GNWEESGIEK LGGGQWQLVV SEIPYMVQKG KLIEQIAQLI 
ADKKLPILED IRDESDEQIR LVLIPKSRNV DPDLLKESLY RLTDLETRFG LNLNVLDSRR 
TPGVLGLKLV LQEWVISQID ILLRRSRHRL DKIASRLELL EGYIIAYLNL DRIIEIIRTE 
DEPKPVMMAE FELTDRQAEA ILNMRLRSLR KLEEMELRKE RDALLAEQEE LQKLLDSPAR 
QRTRLKRDLA ALRKDYAEDT ALGRRRTTIA EAAPTREFSM DAMIEKEPVT VILSAKGWIR 
AAKGHVPLDG DFKFKEGDGP AFALHCQTTD KLLVAVDNGR FYTLGADKLP GARGFGEPIR 
TMVDIDPDAQ IVSVLPYKPK GQLLLAANTG RGFAAEMDEL LAETRKGRGV VSTKPGVKLA 
VVREIAPEHD HVAVIGENRK LVIFALSEVP LLAKGQGVTL QRYKDGEMSD VITLRLEDGL 
TWAMGGESGR TRVEKDLLPW KVARGAAGRL PPNGFPRDNR F