Gene Lcho_2110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_2110
Symbol
ID	6161348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	-
Start bp	2305795
End bp	2306946
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	72%
IMG OID	641664879
Product	hypothetical protein
Protein accession	YP_001791142
Protein GI	171058793
COG category	[L] Replication, recombination and repair
COG ID	[COG4335] DNA alkylation repair enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.498409
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACAA TGCCGGTCAT GGCTGACGCA TTCAAGAACC TGATCAACCC CGCCACCGTC 
GCGGCGATGG CGCAGCACCT CGGGCGGGTC AGCGCGCATT TTGATCACGA CGCCTTCGTC 
GCGCGCGCCT TGCCCGATCT CGACGGCCTC GAATTCAAGG CCCGCGCGAT GCAGCTGGCC 
GACGCGCTCG AGCAGGCGCT GCCGGCCGAT TTCAGCCTGG CGTCGCAGGC GCTGGTGAAT 
GCGCTCGGGC CGCCGGGGCA GGGCGACGAT CTGAGCGGGC TGCGGACCGG CGATCAGGGC 
CTGGCCGGCT GGGCGCTGTG GCCGATGGGC GAGTTCATCG CCCGCCACGG CCTGGCCGAT 
CCCGCGCGCG GGCTGCAGGC GCTGCACGCG ATGACACAGC GTTTCAGCGC CGAGTTCGCG 
ATCCGGCCGT TCATCCTGGC GCATCCGCAG CTGACGTTCG AGACCCTGGC GCGCTGGGTG 
CACGACCCGA GCGCACATGT GCGCCGACTG GTCAGCGAGG GCAGCCGCCC GCGCCTGCCG 
TGGGGCCTGC AGCTCAAGCC GCTGATCGCC GACCCGAGCC CGACGCTTGC GCTGCTGGCC 
GCGCTGCAGG ACGACCCCAG CGCCTACGTG CGCCGCTCGG TCGCCAATCA TCTCAACGAC 
ATCGCCAAGG ATCATCCCGC GCGCGTGGCC GAGTGGCTGC AGCGCCATCT GCCCGATGCG 
TCCGACAACC GCCGGGCGCT GCTGCGCCAC GCCAGCCGCA CGCTGATCAA GCAGGGTGAC 
GCCGCGGTGC TGACGGCCTG GGGCCTGGGC GCCGAACTGC ACGGCCAGGC GGCGCTGCGC 
ATCGGGCCGG CGCGCATCCG GCTGGGCGAA GCCGTCGAGC TGAGCCTGAC GCTGCGTTCG 
ACCGCAGCCG CCGCGCAGGC GCTGGTGGTC GACTACGTGG TGCACCACGT CAAGGCCGGC 
GGCAGCACGT CGCCCAAGGT CTTCAAAGGC TGGCGCGTGC AACTGGCGGC GGGCGAGCAG 
CGGCTGCTCA GCCGCCGCCA CAAGGTGACG CCGATCACCA CCCGCACCTA TCACGCGGGT 
TGGCATCGCG TGCAGGCGCA GGTCAACGGA CGGGTGGTGG CCGAAGCGGG GTTCGAGCTG 
GGTGTCGATT GA

Protein sequence

MATMPVMADA FKNLINPATV AAMAQHLGRV SAHFDHDAFV ARALPDLDGL EFKARAMQLA 
DALEQALPAD FSLASQALVN ALGPPGQGDD LSGLRTGDQG LAGWALWPMG EFIARHGLAD 
PARGLQALHA MTQRFSAEFA IRPFILAHPQ LTFETLARWV HDPSAHVRRL VSEGSRPRLP 
WGLQLKPLIA DPSPTLALLA ALQDDPSAYV RRSVANHLND IAKDHPARVA EWLQRHLPDA 
SDNRRALLRH ASRTLIKQGD AAVLTAWGLG AELHGQAALR IGPARIRLGE AVELSLTLRS 
TAAAAQALVV DYVVHHVKAG GSTSPKVFKG WRVQLAAGEQ RLLSRRHKVT PITTRTYHAG 
WHRVQAQVNG RVVAEAGFEL GVD