Gene Lcho_3670 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_3670
Symbol
ID	6160418
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	+
Start bp	4104862
End bp	4105917
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	68%
IMG OID	641666443
Product	cupin 2 domain-containing protein
Protein accession	YP_001792689
Protein GI	171060340
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3435] Gentisate 1,2-dioxygenase
TIGRFAM ID	[TIGR02272] gentisate 1,2-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGGGG AACACACCAT GCAAGAACTT GGACGCCTCG AAGACCTGCC CGCCGACTAC 
GTGCAGGCAC TGCGTGACCT GAACCTCGTG CCGCTGTGGC CGAGCCTGCG CGGCGTGCTG 
CCGCCGGGCA AGCCGCGGCC CAACACCCGC GCCACCGCCT GGGCCTACGA ATCGATCAAG 
CCGCTGCTGC TGAAAGCCGG CGAACTGACG CCGATCGAGA AGGCCGAGCG CCGCGTGCTG 
GTGCTCGCCA ACCCCGGCCA CGGCCTGGAG AAGATGCAGG CCAGCGCCGC GATGTACCTC 
GGCATGCAGT TGCTGCTGCC GGGTGAGTGG GCGCCGTCGC ACCGCCACAC GCCCAACGCG 
GTGCGCATGA TCGTCGAGGG TGAAGGCGCC TACACCACGG TCGACGGCGA GAAGTGCCCG 
ATGTCGCGTG GCGACCTGAT CCTGACACCC ACCGGCCTGT GGCACGAACA CGGCCACGAC 
GGCAGCGAGC CGGTGGTCTG GCTCGACGTG CTCGATCTGC CGCTGGTCTA TTACATGGAG 
GCCTCGTATC ACATCAACGG CGAGCGCCAG ACCGTCAAGC CCGGCCAGGG TGACCGCGCC 
TATGCACGCG GCGGCGTGGC GCCGACGGTG ATGTTCGATC GCTCGGACAA GCGCTACCCG 
ATGCTGCGCT ACCCGTGGGT CGACGCACGC GCCGCGCTGG TGTCGCTGGC CGCCGACCGG 
CCGGATCTGG ACGCGGTGCA GGTCACCTAC GTCAACCCCG AGACCGGCGC CGACGTCGAG 
AACATCCTCG GTTTCTACGC GCTGATGCTG CGCCCGGGCC AGACGCTGCG CCTGCCGGTG 
CGCTCGCCGG CGATGGTGTT CCACGTCATC GAAGGTGGTG CCGAGGTGAA GGTCGAAGAC 
CAGCGTTTCA CGCTCACCGA GGCCGACACC TGCTGCGCGC CCGGCTACAC CGAGGTGAGC 
CTCGTCAACC GCTCGGCCGA CACGCCCACC TTCGTCTTCA TCGCCGACGA ATCGCCGCTG 
CACCGCAAGC TCGGCGTGTT CGAGAACCGC GGCTGA

Protein sequence

MIGEHTMQEL GRLEDLPADY VQALRDLNLV PLWPSLRGVL PPGKPRPNTR ATAWAYESIK 
PLLLKAGELT PIEKAERRVL VLANPGHGLE KMQASAAMYL GMQLLLPGEW APSHRHTPNA 
VRMIVEGEGA YTTVDGEKCP MSRGDLILTP TGLWHEHGHD GSEPVVWLDV LDLPLVYYME 
ASYHINGERQ TVKPGQGDRA YARGGVAPTV MFDRSDKRYP MLRYPWVDAR AALVSLAADR 
PDLDAVQVTY VNPETGADVE NILGFYALML RPGQTLRLPV RSPAMVFHVI EGGAEVKVED 
QRFTLTEADT CCAPGYTEVS LVNRSADTPT FVFIADESPL HRKLGVFENR G