Gene M446_5045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_5045
Symbol
ID	6135698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	5525986
End bp	5527155
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	72%
IMG OID	641645181
Product	putative DNA topoisomerase I
Protein accession	YP_001771806
Protein GI	170743151
COG category	[L] Replication, recombination and repair
COG ID	[COG3569] Topoisomerase IB
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.110319
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00920421
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCGTCGG ATCCCGAGAC CGCGCCGTCC GCGCCGGAGG GTCGCGCCGA CCCGCGCGAG 
GCCGCCCGCG AGATCGGGCT GCGCTACGTC AGCGACGAGG AGCCCGGCTA TCGCCGCAAG 
CGCAACGGGC GCGGCTTCCG CTACATCGAC CCGGACGGCC GGCCGGTCCG CGACGAGGCG 
GTGCTCAAGC GCATCAGGGC CCTGGCGATC CCGCCGGCCT ACACGGATGT CTGGATCTGC 
CGGCATCCCA ACGGGCACAT CCAGGCGACG GGGCGGGACG ATCGCGGCCG CAAGCAGTAC 
CGCTACCATC CGCAGTTCCG GGAGGCGCGG GACTCGACCA AGTTCGCCCA CATGATGGAC 
TTCGCGCGGG CGCTGCCGGC CCTGCGGGCG CGGGTGCAGG AGGATATGGG CCGGCGGGGC 
CTGCCGCGGG AGAAGGTGCT CGCCACGGTG GTCCACCTGC TGGAGACCAC GCTGATCCGG 
GTCGGGAACG ACGATTACGC CCGCGCCAAC CGCTCCTTCG GGCTCACGAC CCTGCGCGAC 
CCGCACGTGA ACGTCGAGGG CGCGGAGCTG AAATTCCGCT TCAAGGGCAA GAGCGGCAAG 
GTCTGGCAGC TGGCCCTGCG CGACCGGCGC GTGGCCAAGA TCGTGAAGGC CTGCCAGGAC 
CTGCCGGGCC AGGAGCTGTT CCAGTACCTC GACGAGGACG GGGTGCAGCG CGACGTGACC 
TCGGCCGACG TCAACGCCTA CCTGCGGGAG ATCACCGGCC GGGACATCAC CGCCAAGGAT 
TTCCGCACCT GGTCGGGCAC GGTGCTGGCG GCCCTGGCGC TGCGGGAATT CGAGACCTTC 
GACAGCCAGG CGGCGGCCAA GCGCAACGTG CGCAGCGCCA TCGAGCGGGT GGCCGAGCGG 
CTCGGCAACA CGCCGACGAT CTGCCGCAAG TGCTACATCC ACCCGGAGAT CCTCGGCTCC 
TACCTCGAAG GGAGCTTCCT GCTGCGGGCG CGCGACGAGA TCGAGGCGGA GCTGCGGGAG 
GACATCCACC GGCTGCGGCC GGAGGAGACC GCCGTGCTGG CTCTGCTCCA GGGGCGGCTG 
GCGGCGGACG CGCCCGCCGA GGGGCCCGCG GCGCAGAGGA GTCGCAAGGG AGCGGGCAGG 
ACCCGCGCGG CTGCCCGCCG GGCGGCCTGA

Protein sequence

MPSDPETAPS APEGRADPRE AAREIGLRYV SDEEPGYRRK RNGRGFRYID PDGRPVRDEA 
VLKRIRALAI PPAYTDVWIC RHPNGHIQAT GRDDRGRKQY RYHPQFREAR DSTKFAHMMD 
FARALPALRA RVQEDMGRRG LPREKVLATV VHLLETTLIR VGNDDYARAN RSFGLTTLRD 
PHVNVEGAEL KFRFKGKSGK VWQLALRDRR VAKIVKACQD LPGQELFQYL DEDGVQRDVT 
SADVNAYLRE ITGRDITAKD FRTWSGTVLA ALALREFETF DSQAAAKRNV RSAIERVAER 
LGNTPTICRK CYIHPEILGS YLEGSFLLRA RDEIEAELRE DIHRLRPEET AVLALLQGRL 
AADAPAEGPA AQRSRKGAGR TRAAARRAA