Gene Lcho_2146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_2146
Symbol
ID	6163888
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	+
Start bp	2346240
End bp	2347457
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	71%
IMG OID	641664914
Product	aldo/keto reductase
Protein accession	YP_001791177
Protein GI	171058828
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.000567174
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCATTC GCCCGACACC CATGAACGCC GACCTTGAAG GTCAAAACCA GCAACGCCGC 
CACCTGATGC TCACCGCCGC CACGCTGGGC GTGGCTCCGT GGCTTCTCTC CGCCTGCGCC 
AGTACCGCCG GCGGTGCAGA GGCAGGCCGC TCGCCGGGCC GCCCACAAGC CGCCGGGGCG 
CGTCGCCGGC TCGGCCCGCT CGAAGTCTTT CCCGTAGGGC TGGGCTGCCA ATGGCGACCG 
GGCGCCACGC CCGGCGTGGT GGTCGATTCG TACAGCAGCC GCTTTGACCG CCCGGCCGCC 
ATCCGCCTCA TCCGCCAGGC CGTGGACCAG GGTGTCACGT TGATCGACAC GGCCGAAGCC 
TACGGCCCCT TCCTGTCGGA AGACATCGTC GGCGAGGCGC TGCAGGGCAT CCGCGACAAG 
GTGGTGCTGG AGACCAAGTT CGGCTTCGAC ATCGATCAGG TCACAGGGCA ACGCCTGCCC 
GGTGGCCGCA ACAGCCGGCC CGAGCACATC CGCCGGGTGG TCGACGCCCA GCTGCGGCGC 
CTGCGCACCG ACCGCATCGA CGTGCTGATC CAGCACCGGG TGGACCCGAA CGTGCCCATC 
GAGGACGTGG CCGGCACGGT CAAGGACCTG ATCGGCGCCG GCAAGGTGCG GCACTTCGGC 
CTGTCCGAGC CCGGCCTGCA GAGCGTGCGC CGCGCCCATG CGGTGCAACC GCTGGCGGTG 
ATCCAGAACG AATACTCGAT GCTGTGGCGT GGCCCCGAGG CCCAGGTGCT GCCGCTGTGC 
GAGGAACTGG GCATCGGCTT CGTCTGCTGG AGTCCGCTGG GCATGGGTTT CCTGGCCGGC 
GGCGTGCGGG CGGATTCGCG CTTCGCGACC GCGCCGATCA CCGACTTCCG CGCCATCTCG 
CCGCGCTTCG CCCCCGAGGT GCTGCCCGCC AACATGGCGC TGGCCGACCT GGTGCGCAAC 
TGGGCGCAAC GCAAGAACGC CACGCCCGGC CAGTTGTCGC TGGCCTGGCT GCTGGCGCAA 
AAGCCCTGGA TCGTGCCGAT TCCGGGCACC ACCAACGCGG CCCACATGAC CGAGAACCTG 
GGGGCGGCCT CGATCTCGTT CACCGCGCAA GAGCTGCAGC AGCTCAACAC CGCGGTGGCC 
GCCATCCGCA TCCAGGGGGA TCGCCTGCCG CCGGCCGTGG CGGTGATGTC GGGCGTCGAG 
GCTGCGCCCA AGCGCTGA

Protein sequence

MSIRPTPMNA DLEGQNQQRR HLMLTAATLG VAPWLLSACA STAGGAEAGR SPGRPQAAGA 
RRRLGPLEVF PVGLGCQWRP GATPGVVVDS YSSRFDRPAA IRLIRQAVDQ GVTLIDTAEA 
YGPFLSEDIV GEALQGIRDK VVLETKFGFD IDQVTGQRLP GGRNSRPEHI RRVVDAQLRR 
LRTDRIDVLI QHRVDPNVPI EDVAGTVKDL IGAGKVRHFG LSEPGLQSVR RAHAVQPLAV 
IQNEYSMLWR GPEAQVLPLC EELGIGFVCW SPLGMGFLAG GVRADSRFAT APITDFRAIS 
PRFAPEVLPA NMALADLVRN WAQRKNATPG QLSLAWLLAQ KPWIVPIPGT TNAAHMTENL 
GAASISFTAQ ELQQLNTAVA AIRIQGDRLP PAVAVMSGVE AAPKR