Gene Lcho_3804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_3804
Symbol
ID	6160483
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	+
Start bp	4268904
End bp	4269917
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	68%
IMG OID	641666577
Product	sulfate ABC transporter, periplasmic sulfate-binding protein
Protein accession	YP_001792823
Protein GI	171060474
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCTC CCCGATTTGC CCGTACCGCG CTGCTGGCGC TGGCCCTCGG TGCCGCCGCG 
CTCGGCGCCG CGGCCCGCGA CATCACGCTG CTCAACGTCA GCTACGACCC GACGCGCGAG 
CTGTACCAGG ACTTCAACAA GGCCTTCGCC GCGCACTGGA AGGCCAAGAC CGGCGACACC 
GTCACCATCC GGCAGAGCCA CGGCGGCTCG GGCAAGCAGG CCCGCTCGGT GATCGACGGA 
CTCGACGCCG ACGTCGTCAC GCTGGCGCTG GCCTACGACA TCGACGAGCT CAACGCCCGC 
GCCGGCCTGA TCCCGGCCGA CTGGCAGAAG CGCCTCAAGC ACAACAGCTC GCCCTACACC 
AGCACCATCG TGTTCCTGGT GCGCAAGGGC AACCCGAAAG GCATCAAGGA CTGGGACGAC 
CTGGTCAAGC CCGGCACCGC GGTGATCACG CCCAACCCCA AGACCTCCGG CGGCGCACGC 
TGGAACTATC TGGCCGCCTG GGGCTACGCG CTCAAGAAGT TCGGCGGCGA CGAGAAGAAG 
GCGCAGGCCT TCGTCGGCCA GATCCTCGCC AACGTGCCGG TGCTCGACAC CGGCGCACGC 
GGCTCGACCA CCACCTTCGT CGAACGCGGC ATCGGCGACG TGCTGCTGAC CTGGGAGAAC 
GAGGCGCTGC TGGCGCAGAA GGAGCTCGGC CCCGACAAGT TCGACATCGT CGCGCCCAGC 
CTGTCGATCC TGGCCGAACC GCCGGTGGCT CTGGTCGACA AGGTGGCCGA CAAGAAGGGC 
ACCCGCGCCG TGGCGCAGGC CTATCTCGAG TACCTCTATT CGCCGGCAGG CCAGGACATT 
GCCGGCCAGA ACTACTACCG CCCGATCGAC CCGACCGTGG CGGCCAAGTA CGCCAGGCAG 
TACCCGAAGG TGACGCTGTT CACCATCGAC GAGGTGTTCG GCGGCTGGGC CCGCGCGCAG 
AAGACCCACT TCGCCGACGG CGGCAGCTTC GATCAGGTCT ACACCAAGAA GTGA

Protein sequence

MTAPRFARTA LLALALGAAA LGAAARDITL LNVSYDPTRE LYQDFNKAFA AHWKAKTGDT 
VTIRQSHGGS GKQARSVIDG LDADVVTLAL AYDIDELNAR AGLIPADWQK RLKHNSSPYT 
STIVFLVRKG NPKGIKDWDD LVKPGTAVIT PNPKTSGGAR WNYLAAWGYA LKKFGGDEKK 
AQAFVGQILA NVPVLDTGAR GSTTTFVERG IGDVLLTWEN EALLAQKELG PDKFDIVAPS 
LSILAEPPVA LVDKVADKKG TRAVAQAYLE YLYSPAGQDI AGQNYYRPID PTVAAKYARQ 
YPKVTLFTID EVFGGWARAQ KTHFADGGSF DQVYTKK