Gene Lcho_1140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_1140
Symbol
ID	6163813
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	-
Start bp	1220088
End bp	1221452
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	70%
IMG OID	641663894
Product	hydroxydechloroatrazine ethylaminohydrolase
Protein accession	YP_001790174
Protein GI	171057825
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACAC TGTTGATCCA CAACGCGCGC CTGCTGGTGA CGATGGACGC CCAGCGGCGC 
GAGATCGCCG ACGGCGCCGT CTTCGCCCGC GACGGCGTGA TCGAGGCGGT CGGCGCCAGC 
GCCGAACTGC CGCAGACCGC CGACGAGGTG ATCGACGCAC GCGATCAGGT CGTCATCCCC 
GGCCTGGTGA ACACGCACCA CCACATGTAC CAGACGCTCA CGCGCGTGAT CCGCCCAGCG 
CAGGATTGCG AGCTGTTCGG CTGGCTGCAG ACGCTCTACC CGATCTGGTC GCACCTGACG 
CCCGAAATGG TGCACGTGTC GACCCAGACC GCGATGGCCG AGCTGCTGCT GTCGGGCTGC 
ACCACCAGCA GCGACCACCT CTACATCTTC CCCAACAGCG TGCGGCTCGA CGACAGCATC 
GAAGCCGCCG CGCAAATCGG CATGCGTTTC CACGCCGCAC GCGGCTCGAT GAGCGTGGGC 
CAGTCGCAAG GCGGCCTGCC GCCCGACGGC GTGGTCGAGA GCGAGCCCGC CATCCTGCGC 
GAGACCCAGC GCCTGATCGA GCGCTGGCAC GACCCGGCGC GCCACGCGAT GCAGCGCATC 
GTGGTGGCGC CGTGCTCGCC GTTTTCGGTC AGCCGCGAGC TGATGCGCGA TGCGGCGGTG 
CTGGCGCGCG AACACGGTGT CTCGCTGCAC ACCCACCTGG CCGAAAACGA CAACGACATC 
GCCTACACGC GTGAGAAGTT CAACTGCACG CCGGCCGAAT ATGCCGAGCA GCTCGGCTGG 
GTCGGCCGCG ACGTCTGGCA CGCCCACTGC GTCAAGCTCG ACGAAGCCGG CATCGCCCTG 
TTTGCGCGCA CCGGCACGGG GGTGTCGCAC TGCCCGGGAT CCAACATGCG ACTCGCCTCG 
GGCATCGCGC CGATCCGTGC CATGCGCGAT GCGGGCGTGC CGGTGTCGAT CGCGGTCGAC 
GGCTCGGCCA GCAACGACAG CGGCCACATG CTCGGCGAGG CGCGGCTCGC GCTGCTGCTG 
CAACGCGTGG CGCACGGCCC GGTCAAGGGA CCGAGTGCAT TGACCGCGCG CGAGGTGCTC 
GAGATCGCCA CGCGGGGCGG CGCCGCGGTG CTCAACCGCG ACGACATCGG CGCGCTCGCG 
CCGGGCATGA GCGCCGACAT CGTGACGATC CCGCTCGACG ACATCGGCCT GGCCGGTGCG 
CACCACGACC CACTGGCCGC GCTGTTCTTC TGCCACGTGC CGCGCGTGAA GCACAGCATC 
GTCAACGGCC GCGTGGTGGT GCGCGACGGG CGCATCACGA CGCTGGAACT GCCGGTGCTG 
ATCGAGCGGC ACAACCGGCT GGCGGCGGAG CTGGTCAACG CCTGA

Protein sequence

MTTLLIHNAR LLVTMDAQRR EIADGAVFAR DGVIEAVGAS AELPQTADEV IDARDQVVIP 
GLVNTHHHMY QTLTRVIRPA QDCELFGWLQ TLYPIWSHLT PEMVHVSTQT AMAELLLSGC 
TTSSDHLYIF PNSVRLDDSI EAAAQIGMRF HAARGSMSVG QSQGGLPPDG VVESEPAILR 
ETQRLIERWH DPARHAMQRI VVAPCSPFSV SRELMRDAAV LAREHGVSLH THLAENDNDI 
AYTREKFNCT PAEYAEQLGW VGRDVWHAHC VKLDEAGIAL FARTGTGVSH CPGSNMRLAS 
GIAPIRAMRD AGVPVSIAVD GSASNDSGHM LGEARLALLL QRVAHGPVKG PSALTAREVL 
EIATRGGAAV LNRDDIGALA PGMSADIVTI PLDDIGLAGA HHDPLAALFF CHVPRVKHSI 
VNGRVVVRDG RITTLELPVL IERHNRLAAE LVNA