Gene Lcho_3640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_3640
Symbol
ID	6163175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	-
Start bp	4065113
End bp	4066438
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	67%
IMG OID	641666413
Product	hypothetical protein
Protein accession	YP_001792659
Protein GI	171060310
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAATCG CCATACTTTT CGCCCTCATC CTGCTCAACG GCCTGTTCGC GATGTCGGAG 
ATCGCGCTGG TCACGGCCCG CAAGGTCCGG CTGCAGAAGC TCATCGATGA GGGCGACCGA 
TCCGCCGAGG CGGCGGTCAA GCTGGGGGAA GATCCGACCC GTTTCCTCTC CACGATCCAG 
ATCGGCATCA CCTCGATCGG CGTGCTCAAC GGCATCGTCG GCGAGGCCGC GCTGGCCAAG 
CCGCTGGCCT TGTGGCTGGA GTCGCTGGGT CTGTCGCAGC TGTATTCGAC CTACGCCGCC 
ACCGGCCTGG TGGTGGTGCT GATCACCTAC TTCTCGATCG TGGTCGGCGA GCTGGTGCCC 
AAGCGGGTCG GCCAGACCCA CCCCGAGACG CTGGCCCGGC TGGTGGCGCG CCCGATCAAC 
TGGCTGGCGA TCGGCACCAA GCCTTTCGTG CGGCTGCTGT CGGTGTCGAC CCACGCGCTG 
CTGCGCCTGC TGGGTGTCAA GGACAACGGC GGCAGCGCCG TCACCGAAGA AGAGATCCAC 
GCCATGCTCG CCGAGGGCAC CAACGCCGGC GTGATCGAGT CGCACGAACA CGCGATGGTG 
CGCAACGTCT TCCGCCTCGA CGACCGCCAG ATCGGCTCGC TGATGGTGCC GCGCGGCGAC 
GTCACCTTCC TCGACGTCGA CCTGCCGTTC GAGCAGAACC TGGCGCGCAT CGAGCAGGCC 
GATCACGCAC GGTTCCCGGT GGTCAAGGGC GGCAGCCTCG ACAACGTGCT GGGCGTCGTC 
AACGCCCGCC AGTGGCTGTC GCGCTCGTTG CGGCTCGACG ACCGCAACCT CGCCGAGCAG 
CCGCTGCAGC ACCCGCTGTA CGTGCCCGAG ACGCTCACCG GCATGGAACT GCTCGACAAC 
TTCCGCCTGT CGGACGTGCA CATCGCCTTC GTGATCGACG AATACGGCGA GGTGCAGGGC 
ATCGTCACGC TGCAGGACCT GATCGAGGCG ATCACCGGCG AGTTCCGCCC GCGCGATCCG 
GAAACCTCGT GGGCGGTGCA GCGCGACGAC GGTTCGTGGC TGCTCGACGG CCACATCCCG 
GTGCCGGAGC TGAAGGACCG GCTCGGCCTC GATTCGGTGC CCGAAGAAGA CCGCGGCCGC 
TATCACACGC TCAGCGGCAT GCTGATGCTG CTGACCGGGC GCCTGCCCAA GGTGGCCGAC 
ACCGCCAGCT GGGAAGGCTG GCGGCTGGAG ATCGTCGACA TGGACGGCAA GACCATCGAC 
AAGGTGCTGG CGAGCCGCAT CCCGGAAGAG GCCGCGACGG ACGGCTCCGA GGTGTCTACC 
GGCTGA

Protein sequence

MEIAILFALI LLNGLFAMSE IALVTARKVR LQKLIDEGDR SAEAAVKLGE DPTRFLSTIQ 
IGITSIGVLN GIVGEAALAK PLALWLESLG LSQLYSTYAA TGLVVVLITY FSIVVGELVP 
KRVGQTHPET LARLVARPIN WLAIGTKPFV RLLSVSTHAL LRLLGVKDNG GSAVTEEEIH 
AMLAEGTNAG VIESHEHAMV RNVFRLDDRQ IGSLMVPRGD VTFLDVDLPF EQNLARIEQA 
DHARFPVVKG GSLDNVLGVV NARQWLSRSL RLDDRNLAEQ PLQHPLYVPE TLTGMELLDN 
FRLSDVHIAF VIDEYGEVQG IVTLQDLIEA ITGEFRPRDP ETSWAVQRDD GSWLLDGHIP 
VPELKDRLGL DSVPEEDRGR YHTLSGMLML LTGRLPKVAD TASWEGWRLE IVDMDGKTID 
KVLASRIPEE AATDGSEVST G