Gene Lcho_2366 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_2366
Symbol
ID	6159754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	-
Start bp	2570116
End bp	2571534
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	68%
IMG OID	641665135
Product	chain length determinant protein EpsF
Protein accession	YP_001791396
Protein GI	171059047
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3206] Uncharacterized protein involved in exopolysaccharide biosynthesis
TIGRFAM ID	[TIGR03017] chain length determinant protein EpsF

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	86
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTTCT CCCAGTTCCT CTCGATCCTC AAGGCTCGCT GGATCGCCGC CCTGCTGGTG 
CTCGTGCTGA CCGTGGGCAC CACCATCGGC GTGAGCCTGA TGCTGCCCAA GAACTACACC 
GCCTCGGCGG CCGTGGTGCT CGACGTGCGC TCGCCCGACC CGATCGCCGG CATGGTGCTC 
GGCGCGATGG CGATGCCGGC CTACATGGCC ACCCAGGTCG ACATCATCCA GAGCGACCGC 
GTCGCCCAGC GCGTGGTGCA GGGCCTGCGC CTGACCGAAA ACCCCGAGAC CCGCCAGCAG 
TGGCAGGACG CCACCGGCGG CAAGGGCAAC TTCGAGGCCT GGCTGGCCGA CCTGCTCAAG 
AAGAAGCTCG ACGTCAAGCC CTCGCGCGAG AGCAACGTCA TCAACATCGG CTACACCAGC 
CCCGACCCGC GTTTTGCGGC GGCACTGGCC AACGCCTTCG TGCGCTCGTA CATGGACGTC 
AGCATCGGCC TGCGGGTGTC GCCGGCCAAG CAGTACAACG AGTTCTTCGA CGCCCGCGGC 
AAGGAACTGC GCGAGGCCCT CGAACAGGCC CAGGCCAAGC TCACCACCTA CCAGAAGACC 
AGCGGCATCC TGGCCACCGA CGAGCGTTTC GACGTCGAGA ACCAGCGCCT CAACGAACTC 
AGCTCGCAGC TCGTGGCCCT GCAGGCGCTG TCGGCCGAAT CGACCAGCCG CAGCGCGCAG 
GCCCGCAACC AGGCCGACCA GCTGGGCGAC GTCATCAACA ACCCGGTGGT GGCCGGCCTG 
CGTGCCGACC TGTCGCGCCA GGAAGCGCGC CTGATGGAAA TGAACTCCAA GCTCGGCGAC 
GCCCACCCGC AGGTGGTCGA GCTGCGCGCC AACATCGCCG AACTGCGTCA GCGCATCGAC 
GGCGAAACCC GCCGCGTCAG CGGCAGCGTG GGCATCAACA ACACCATCAA CAAGGCCCGC 
GAAGGCGAAG TCCGCGCCGC CCTCGAAGCC CAGCGCGCCA AGGTGCTGGC GCTCAAGCAG 
CAGCGCGACG AGGCGCTGGT GCTGATGAAG GAAGTCGAGA CCGCCCAGCG CGCCTACGAC 
CAGGTGGTGG CCCGTGCCAG CCAGACCAAC CTCGAGAGCC AGAACACCCA GACCAACATC 
TCGGTGCTCA CGCCCGCCAC CGAGCCGGCC GACCATTCGT CGCCCAAGCT GCTGCTCAAC 
GCCTTGCTGA GCGTCTTCCT GGGTACCTTG CTGGCGGTCG GCTTTGCGCT GGTGCGCGAA 
CTGATGGACC GCCGCGTGCG CACCGTCGAA GACCTGGCCG AAGGCCTCGG CCTGCCGGTG 
CTGGGCGCGC TGCCCAAGCC GATGCGCGGA TCGGCCCGCA GCCCGGCGCT ACAGCTGCCC 
ATCAACGTGA TGGCACGCCT TCCCCGTGCC GGCGCCTGA

Protein sequence

MTFSQFLSIL KARWIAALLV LVLTVGTTIG VSLMLPKNYT ASAAVVLDVR SPDPIAGMVL 
GAMAMPAYMA TQVDIIQSDR VAQRVVQGLR LTENPETRQQ WQDATGGKGN FEAWLADLLK 
KKLDVKPSRE SNVINIGYTS PDPRFAAALA NAFVRSYMDV SIGLRVSPAK QYNEFFDARG 
KELREALEQA QAKLTTYQKT SGILATDERF DVENQRLNEL SSQLVALQAL SAESTSRSAQ 
ARNQADQLGD VINNPVVAGL RADLSRQEAR LMEMNSKLGD AHPQVVELRA NIAELRQRID 
GETRRVSGSV GINNTINKAR EGEVRAALEA QRAKVLALKQ QRDEALVLMK EVETAQRAYD 
QVVARASQTN LESQNTQTNI SVLTPATEPA DHSSPKLLLN ALLSVFLGTL LAVGFALVRE 
LMDRRVRTVE DLAEGLGLPV LGALPKPMRG SARSPALQLP INVMARLPRA GA