Gene Lcho_3299 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_3299
Symbol
ID	6162210
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	+
Start bp	3666209
End bp	3667474
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	68%
IMG OID	641666074
Product	extracellular solute-binding protein
Protein accession	YP_001792322
Protein GI	171059973
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTCT CGTCCCCCCT TCGCCGCAGC CTCGTCGTCC TGGGCCTGGC TGCCCTCGGT 
GCCAGCGCCG CCCAAGCCCA GACCTCGCTG TCGATGTGGT ATCACGGTGC CGGCAACCCG 
AAGGAGAAGG AGCTGATGAC GGGGATCATC AGCGACTTCA ACAAGAGCCA GAAGGAGTGG 
AAGGTCGAGC TGCAGCAGTT CCCACAGGAG GCCTACAACA CCTCGGTGGT GGCCGCCGCG 
GTGGCCGGCA AGCTGCCTGA CATCCTCGAC GTCGACGGCC CGGTGATGCC CAACTGGGCC 
TGGTCGAAGT ACCTGCAGCC GCTGGCCCTG CCGGCCGGCG CGACCGACAA GTTCCTGCCC 
GGCACGATCG GCACCTACAA CGGCAAGGTC TACTCGGTCG GCCTGTGGGA CGCGGCCTGT 
GCGATGTTTG CCCGCAAGTC GGTGCTGCAG GCCCACAACA TCCGCATCCC GACGCTCGAC 
AAGCCCTGGA CCAAGGCCGA GTTCGACGCC GCACTCGTGA CGCTGCAAAA GAGCGGCAAG 
TTCCAGTACC CGATCGACCT GGGCCTGGCC TGGAAGGGCG AGTGGTACTC GTACGCCTTC 
GGCCCCTTCC TGCAGAGCCA CGGCGGTGAC CTGCTGAACG CGGCTGCGCC CAAGGCCAAC 
GGCACGCTCA ACGGCCGTGC CGGCGTCGAG TTCGGCACCT GGTGGCAGAG CCTGTTCACG 
CGCAAGCTGA CCCCGGGCAC CTCGCAGAGC GGCGCCGACC GCGAGACCGG CTTCCTCGAC 
GGCAAGTACG CGCTGCAGTG GAACGGCAAC TGGGCCGCGC TGCCGGCGCT GAAGAAGTTC 
GGCGACGACC TGGTCTTCCT GCCGGCGCCC GACTTCGGCA AGGGCCCGAA GATCGGCGCC 
GCGTCGTGGC AGTTCGGCGT CTCGGCCACC AGCAAGAACG CCAAGGGCGC GAACGCCTTC 
ATCGCCTTTG CGCTCAAGGA CAAGTACCTG GCGGCCTTCT CCGACGGTAT CGGCCTGATC 
CCGTCGACCC CGGCGGCCGC GGCGCTGACG CAGAACTACA AGAAGGGCGG CCCGCTGGAG 
GTGTTCTTCG CGCTGTCGGC CAAGCAGGCC ACGCTGCGCG CGTCGACGCC GGGTTATGCC 
GGCGCGTCGG GCGAGTTCGA GAAGGCGCTG GCCGACATCG CCAACGGCGG CAAGGTCGCC 
GATGCACTCG ACAACGCCGC CGACGCGATC GACGCCGACC TGAAGAAGAA CGGCAACTAC 
CGCTGA

Protein sequence

MTVSSPLRRS LVVLGLAALG ASAAQAQTSL SMWYHGAGNP KEKELMTGII SDFNKSQKEW 
KVELQQFPQE AYNTSVVAAA VAGKLPDILD VDGPVMPNWA WSKYLQPLAL PAGATDKFLP 
GTIGTYNGKV YSVGLWDAAC AMFARKSVLQ AHNIRIPTLD KPWTKAEFDA ALVTLQKSGK 
FQYPIDLGLA WKGEWYSYAF GPFLQSHGGD LLNAAAPKAN GTLNGRAGVE FGTWWQSLFT 
RKLTPGTSQS GADRETGFLD GKYALQWNGN WAALPALKKF GDDLVFLPAP DFGKGPKIGA 
ASWQFGVSAT SKNAKGANAF IAFALKDKYL AAFSDGIGLI PSTPAAAALT QNYKKGGPLE 
VFFALSAKQA TLRASTPGYA GASGEFEKAL ADIANGGKVA DALDNAADAI DADLKKNGNY 
R