Gene Lcho_1386 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_1386
Symbol
ID	6159841
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	-
Start bp	1470768
End bp	1471976
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	68%
IMG OID	641664140
Product	hypothetical protein
Protein accession	YP_001790419
Protein GI	171058070
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5653] Protein involved in cellulose biosynthesis (CelD)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCA GGGCGATCCG GACACTGCAG GAACTGGCGC CGGTGCGCGC GCGCTGGCAG 
CAATGGCAGG ACCACGTCAA CAACGATCTG GCGCAGTTCG AGCTGGTGTG CCGGCACCGC 
ACGGAAGTCG AATCGCCGTG CGTGATCGTG ATCGAGCAGG ACAGCGAAAA CAACCGCGAC 
AGCGGCCCCG ATGCGCTGCT GCTCGGGCGC ATCGAGTGCA ACCCCTTCGC GCCGTCGATC 
GGCTATCTGC AGCCGGTGCG CATGCCCGCG CGGGTGCTGG TCGTGATCCA TCAGGGCTTG 
CTCGGCAAGC TCGACGACGC AGCCGCCGGC GAGGTCATCG GCTACCTGCG ATCGCTGTTG 
CGCAGCGGTG TGGCCGATGC GGTGGCCTTT CATCATCTGC CGGAACACTC GCCGCTGTGG 
CAGGCGCTGC AGATCGAGCG CGACACAAGG CTGAGCGTGA AGGCGCCGAG GTGGGCAACC 
CACCACGAGA TGCGGCTGCC CGACGACGGC CGCTCGGTCG ACAGCAAGCT CAGCGCCAAG 
CACCGCAGCA ACATGCGCCG CCATCAGAAG GACCTCGAGG CGGCTTTCCC GGGCCGGGTG 
GTCTGGCGCT GGATGAACGC CGTCGACGAC ATCGCCGCGC TGTGCGCACA CCTGGAGCCG 
TTGGCTGCAC GCACCTATCA GCGCGCGCTG GGTGTCGGCT TCTTCGACGA CGACGACCAC 
CGGCGCCGCT ACGAGCTGTT TGCGCGCCGC GGGCAATTGC GGGTGCAGCT GCTGGAGATC 
GACTCGCAGG TGCGGGCCTT CTGGATCGGC TCGATCTATG CGGATGTCTT CAACCTGTCC 
GAGACCGGCT ACGACCCGGA TCTGCGCGAG TTCAAGGTCG GCACCCTGCT GTTCATCCGG 
CTGGCCGACG CGCTGGCGCA AGAAGGCGTG CGACGGCTCG ATTTCGGCCT CGGCGACGCA 
CCGTACAAGG CGCGCTTCGG CGACCGGAGC TGGCGCGAGA CACCGGCCTG GCTGTTCGCC 
CCGACCGCCA GGGGCATGGC CATGATGCTG CTGCTCAAGC TGTCGCTGGC GCTCGACTCC 
GGGGCACGGC GCCTGGTGCA GCACGCCGGC CTGACCGACC GGATCAAGAC CGGCTGGCGA 
CGCCGCAAGG CTGCGTCCGG CACTCGGCTG ACGCCGAGCC ACCCTGCCAC TGCGAGGGAT 
CGAGCATGA

Protein sequence

MRIRAIRTLQ ELAPVRARWQ QWQDHVNNDL AQFELVCRHR TEVESPCVIV IEQDSENNRD 
SGPDALLLGR IECNPFAPSI GYLQPVRMPA RVLVVIHQGL LGKLDDAAAG EVIGYLRSLL 
RSGVADAVAF HHLPEHSPLW QALQIERDTR LSVKAPRWAT HHEMRLPDDG RSVDSKLSAK 
HRSNMRRHQK DLEAAFPGRV VWRWMNAVDD IAALCAHLEP LAARTYQRAL GVGFFDDDDH 
RRRYELFARR GQLRVQLLEI DSQVRAFWIG SIYADVFNLS ETGYDPDLRE FKVGTLLFIR 
LADALAQEGV RRLDFGLGDA PYKARFGDRS WRETPAWLFA PTARGMAMML LLKLSLALDS 
GARRLVQHAG LTDRIKTGWR RRKAASGTRL TPSHPATARD RA