Gene Rleg_0001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0001
Symbol	dnaA
ID	8015384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	55
End bp	1605
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	62%
IMG OID	644822592
Product	chromosomal replication initiation protein
Protein accession	YP_002973852
Protein GI	241202756
COG category	[L] Replication, recombination and repair
COG ID	[COG0593] ATPase involved in DNA replication initiation
TIGRFAM ID	[TIGR00362] chromosomal replication initiator protein DnaA

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.962631
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.00495499
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCAGATGA ATACGATGAC GACGAGCGGG CTCGACAATG GGGATGCGGC ACCGCAGGCG 
TTCGGCTCCA TTCGCCTGGA AGCGGCGGAA GTAAAGGCGG ATATGAAGCA GAACGTATTG 
TTTGAGCGCG TCACCGCGCG CTTGAAGGCT CAGGTCGGTC AGGATGTCTA CGCCAGCTGG 
TTCGCCCGGC TGAAGCTGCA TTCGGTATCG AAGAGCGTCG TTCGCCTTTC GGTCCCCACG 
ACCTTCCTGA AGTCGTGGAT CAACAATCGT TATCTCGATC TCATCACCGG TCTGTTCCAG 
GCCGAAGATC CGGAAATTCT GAAAATCGAA GTCCTGGTGC GTACGGCGAC GCGCCACGGC 
ACGAAGGCGC TCGATGAGGC GGTCGCGCCG GAACCAGCCG CCCCTACGCA GATGCGCCGC 
CCGGCAAGCG CTCAGCCGGC CGGTCAGGCC GTCCAGCAGG CGGTTTCGGC CGTTGCCGCC 
GCAAGGCCCG CAAGCTTCGG CTCGCCGCTC TTCGGTTCGC CGCTCGATAG CCGCTTTACC 
TTCGACACCT TCGTCGAAGG CAGCTCGAAC CGGGTAGCAC TTGCGGCTGC AAAGACGATC 
GCGGAAGCCG GTCAGGGCGC CGTGCGCTTC AACCCGCTCT TCATCCATTC GACCGTCGGC 
CTCGGCAAGA CCCACCTGCT GCAGGCTGTC GCCAATGCGG CAGTGCAGAA CCCCAGGGCT 
CTGCGCGTCG TCTATCTGAC GGCCGAATAT TTCATGTGGC GTTTCGCCAC CGCGATCCGC 
GACAATGATG CGCTGACGCT GAAGGATTCG CTGCGCAACA TCGATCTCTT GATCATCGAC 
GACATGCAGT TCCTGCAGGG CAAGATGATC CAGCATGAAT TCTGCCATCT CCTCAACATG 
CTTCTCGACA GCGCCAAGCA GGTCGTCGTT GCCGCCGACC GTGCGCCCTG GGAGCTGGAG 
TCGCTCGACC CCCGCGTTCG CTCGCGCCTC CAGGGCGGCG TCGCGATCGA ATTCGACGCG 
CCGGATTACG AGATGCGTCT CGAAATCCTC AAGCGTCGCC TTGCTGTCGC CCGGCTCGAA 
GATCCGTCGC TCGAAATTCC GGCCGAGTTG CTCCAGCATG TCGCTCGCAA CGTCACGGCC 
AGCGGCCGCG AACTTGAAGG CGCTTTCAAC CAGCTGGTCT TCCGCCGCTC CTTCGAGCCG 
AACCTGTCGA TCGAACGCGT CGACGAACTG CTCGCCCATC TGGTCGGCTC CGGCGAACCC 
CGCCGTGTGC GCATCGAGGA TATCCAGCGC ATCGTTGCAA GACACTACAA TGTCTCGCGC 
CAGGAACTGG TGTCGAACCG CCGCACCCGC GTCATCGTCA AGCCGCGCCA GATCGCCATG 
TATCTGTCGA AGACGCTGAC GCCACGCTCC TTCCCGGAGA TCGGCCGCCG TTTCGGCGGG 
CGTGATCACA CGACCGTGCT GCACGCCGTG CGCAAGATCG AGGAACTAAT TTCGGGAGAC 
ACCAAGCTTT CGCACGAAGT CGAGCTTCTG AAGCGCCTGA TCAACGAATA G

Protein sequence

MQMNTMTTSG LDNGDAAPQA FGSIRLEAAE VKADMKQNVL FERVTARLKA QVGQDVYASW 
FARLKLHSVS KSVVRLSVPT TFLKSWINNR YLDLITGLFQ AEDPEILKIE VLVRTATRHG 
TKALDEAVAP EPAAPTQMRR PASAQPAGQA VQQAVSAVAA ARPASFGSPL FGSPLDSRFT 
FDTFVEGSSN RVALAAAKTI AEAGQGAVRF NPLFIHSTVG LGKTHLLQAV ANAAVQNPRA 
LRVVYLTAEY FMWRFATAIR DNDALTLKDS LRNIDLLIID DMQFLQGKMI QHEFCHLLNM 
LLDSAKQVVV AADRAPWELE SLDPRVRSRL QGGVAIEFDA PDYEMRLEIL KRRLAVARLE 
DPSLEIPAEL LQHVARNVTA SGRELEGAFN QLVFRRSFEP NLSIERVDEL LAHLVGSGEP 
RRVRIEDIQR IVARHYNVSR QELVSNRRTR VIVKPRQIAM YLSKTLTPRS FPEIGRRFGG 
RDHTTVLHAV RKIEELISGD TKLSHEVELL KRLINE