Gene Hhal_1983 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1983
Symbol
ID	4710330
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	2185927
End bp	2187837
Gene Length	1911 bp
Protein Length	636 aa
Translation table	11
GC content	69%
IMG OID	639856456
Product	DNA topoisomerase IV subunit B
Protein accession	YP_001003549
Protein GI	121998762
COG category	[L] Replication, recombination and repair
COG ID	[COG0187] Type IIA topoisomerase (DNA gyrase/topo II, topoisomerase IV), B subunit
TIGRFAM ID	[TIGR01055] DNA topoisomerase IV, B subunit, proteobacterial

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.267905
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACCA AGACCCAGCA GACCTACGAC GCCTCCGACA TCGAAGTCCT GACCGGACTG 
GAGCCGGTAC GCCGGCGTCC CGGTATGTAC ACCGAAACCA ACCGCCCCGA CCACCTCGCC 
CAGGAGGTGA TCGACAACAG TGTCGACGAG GCGGTCGCCG GACACGCCCG GCGCATCGAG 
GTGACCGTGC ACGCTGATGG CTCCCTGGAG GTCAGCGACG ACGGCCGCGG CATGCCGGTG 
GATATGCATC CCACCGAGGG GGTGCCCGCG GTCGAGGTGA TCCTCGGCCG GCTCCACGCC 
GGCGGCAAGT TCTCGAGCAA GAGCTACCGC TATTCCGGCG GCCTGCACGG GGTCGGTGTC 
TCCGTGGTGA ACGCGCTATC GACGCGGCTG CAGGTGCATA TCCGCCGCGA CGGCGCCGAG 
CACACCATCG CCTTCTCGGC GGGGGAGCGG ATCGAGCCGC TGGAGCGGGT GGGCAAGACG 
CGGGAGACCG GCACCACGCT GCGCTTCTGG CCGGATACCA GCTACTTCGA CAGCCCGCGC 
TTCTCTCGCG CCCGGCTCGA GCACCTGCTG CGCGCCAAAG CGGTGCTCTG CCCGGGGCTG 
ACGGTCATCC TGCGCGACGC CACCGGGGGC GAGGGGCAGG AGCCCGAGGT GCTGACCTGG 
TACTACGAGG ATGGGCTGCG CGATTACCTG GCCGGTGCCG TGGCCGACTA CGAGCATCTG 
CCGGATCCGC CGTTCACTGC CCGGCTCGGC TCCGAGCACG AGGAGATGGA GTGCGCCCTG 
GTGTGGTTGC CGGAGGGCAG CGGGCCGGCG GAGAGCTACG TCAACCTCAT CCCCACTCCT 
CAGGGCGGGA CCCACGTCAA CGGCCTGCGC ACCGGCCTGA CCGAGGCCAT GCGCGAGTTC 
TGCGAGCTGC GTAACCTGCT GCCGCGCGGG GTGCGCATCG CCCCGGAGGA CGTCTGGGAG 
CACATCAGCT ACGTGCTGTC GGTGAAGATG CATGAGCCGC AGTTCGCCGG GCAGACCAAG 
GAGCGGCTCT CCTCGCGCAA CTGTGCCGCC TTCGTCTCCG GGGCCGTGAA GGACGCCTTC 
AGCCTGTGGC TCAACGAGCA CACCCAGAGC GCCGAGCAGA TTGTCGATCT GGTGGTGCGC 
GCCGCTCAGC GCCGCCAGCG GGCCGCCAAG AAGGTGACGC GCAAGCGGGT GGGCAGTGGG 
CCGGCGCTGC CCGGCAAGCT GGCCGACTGC ACCGGGCAGG ATCCGGCGCG CAGCGAGCTC 
TTCCTGGTCG AGGGGGATTC CGCCGGCGGC TCGGCCAAGC AGGCCCGCGA ACGGGAATTC 
CAGGCGGTCA TGCCGCTGCG CGGTAAGATC CTCAATACCT GGGAGGTGGC TCCCGACGAG 
GTCATGGCCT CCCAGGAGGT CCACGATATC GCCGTGGCCC TGGGGGTCGA CCCGGGCAGC 
GAGGACCTCT CCGGGCTGCG CTACCACAAG GTCTGCGTCC TGGCCGACGC TGACCCCGAC 
GGCGCGCACA TTGCCACGCT GCTCTGCGCC CTGTTCCAGC GCCACTTCCC GGCCCTGGTG 
GCCGGCGGCC ACGTCTACGT GGCGATGCCG CCGCTGTATC GCATCGATGT TGGCAAGCAG 
ACCTTCTACG CCCTCGACCG CGACGAGCGC CAGGGTATCC TCGACCGGAT CGAGGCCGAG 
CGCATCAAGG GCAAGGTGCA GGAGACGCGC TTCAAGGGCC TTGGTGAGAT GAACCCGGTC 
CAGCTGCGCG AGACCACCAT GGCCCCGGAT ACCCGCCGCC TGGTTCAGCT CACCGTCGAT 
GACCCCGACG AGACCGAACG CCTGCTCGGC ATGCTGCTCG GCCGTGGCGC CGCAGCCCAG 
CGCCGCGAGT GGCTGGAGAG CAAGGGCAAC CTGGCGGAAA TCGTCCTTTG A

Protein sequence

MTTKTQQTYD ASDIEVLTGL EPVRRRPGMY TETNRPDHLA QEVIDNSVDE AVAGHARRIE 
VTVHADGSLE VSDDGRGMPV DMHPTEGVPA VEVILGRLHA GGKFSSKSYR YSGGLHGVGV 
SVVNALSTRL QVHIRRDGAE HTIAFSAGER IEPLERVGKT RETGTTLRFW PDTSYFDSPR 
FSRARLEHLL RAKAVLCPGL TVILRDATGG EGQEPEVLTW YYEDGLRDYL AGAVADYEHL 
PDPPFTARLG SEHEEMECAL VWLPEGSGPA ESYVNLIPTP QGGTHVNGLR TGLTEAMREF 
CELRNLLPRG VRIAPEDVWE HISYVLSVKM HEPQFAGQTK ERLSSRNCAA FVSGAVKDAF 
SLWLNEHTQS AEQIVDLVVR AAQRRQRAAK KVTRKRVGSG PALPGKLADC TGQDPARSEL 
FLVEGDSAGG SAKQAREREF QAVMPLRGKI LNTWEVAPDE VMASQEVHDI AVALGVDPGS 
EDLSGLRYHK VCVLADADPD GAHIATLLCA LFQRHFPALV AGGHVYVAMP PLYRIDVGKQ 
TFYALDRDER QGILDRIEAE RIKGKVQETR FKGLGEMNPV QLRETTMAPD TRRLVQLTVD 
DPDETERLLG MLLGRGAAAQ RREWLESKGN LAEIVL