Gene Lcho_3071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_3071
Symbol
ID	6162634
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	-
Start bp	3398745
End bp	3399926
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	60%
IMG OID	641665846
Product	protein involved in cellulose biosynthesis (CelD)-like protein
Protein accession	YP_001792096
Protein GI	171059747
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5653] Protein involved in cellulose biosynthesis (CelD)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAGCAA CGCAATACGG CATCTCATTT GATGCGCTTC CGCCCCTGAA CGAACTTGAA 
GCTCTCTGGC GCGATCTTGA GTTGCGCGCT CCAGATGCCA GTTTCTTCAA CTCGTGGTCT 
TGGATCGGCT GTTGGCTCGA GTTGCTGCCG GACCAGTTCG AGCGTCGTCT GCTCAAGGCC 
GTCTCTGGTG GACGTGTCGT TGGGCTCGGT GTCCTGGTGC GCAACACGCG AAAGTTGGGC 
GGAATGCCGT TCTGCACGGC TTGGCACCTG CACGCTGCGG GAGATCCCAT CTACAACGGT 
GCGATGGTCG AGCACAATGA TTTTCTGCTG GACGGTCAAC ATGGCGACGC CTTGCGGGAG 
GCCCTTGTCA AGCGGTGGGC CGACTGCGTG GGCGCCGGTC AAGAGTTGCA CCTGCCCGGT 
CTCGAAGGGC ACGGCTACTC TGCCGAAGTG AGCGGAAACC TGGAGCGTCA CGATGAGCAG 
CGCATGTCCT ATGCGATTGC GCTCGAACCT GTTCGAGCGC ACAAGCTTGA TTTCACGCCT 
TTGGTGAGTG GCCACGCTCG GCGGTTCATC CGTCGCAGCA TCAAGGAGTA TCAGACCCTG 
GGTCCGATCG AGGTGACTGT CGCCGTTGAT GTTGAACAGG CACTGAGTTT CTTCGACAAG 
ATGGTGGCCC TGCATCAGGA TCGCTGGGCG GCTCTCGGCG AAGATGGCTC ATTCAAGAGC 
GAATTCCGGT TCCAACTCCA TCGGCTGGTC ATTGCGCGTC AGTTGGCGCG GGGCGAAATC 
CAGATGCTGC GGGTCCGAGC CGGTGAGCGG GATGTCGGGT ATCTCTACAG TTTCATACGA 
GGGAAGCGAC TTTACGTCTA TCAGTCCGGT TTCGATTACA CCGTGCTGGA GAAGCACGGC 
CGTCCCGGCT TGGTGACTCA TACCTTGGCG GTGCAGCACA ACGCGGCTCT CGGCTTCGAT 
GTCTATGACT TGATGGCCGG TGAATCGCAG TACAAGTCCA CCATCTCGAC GGTGCACGAG 
ACGTTGACAT GGTCGGTCTG GCGCAAGCCC GCGATCCGGT TCGCGGTCGA GCGACAACTC 
CGCAGTGCTG TTGGAAGCTA TCGACGCTGG CGTGCTGCGC GAGTCGATAA GGCCTCGGGT 
CCCGCTCAGG AAGAAGCCAG ACAGGCTGCC GAGGAGGCAT GA

Protein sequence

MAATQYGISF DALPPLNELE ALWRDLELRA PDASFFNSWS WIGCWLELLP DQFERRLLKA 
VSGGRVVGLG VLVRNTRKLG GMPFCTAWHL HAAGDPIYNG AMVEHNDFLL DGQHGDALRE 
ALVKRWADCV GAGQELHLPG LEGHGYSAEV SGNLERHDEQ RMSYAIALEP VRAHKLDFTP 
LVSGHARRFI RRSIKEYQTL GPIEVTVAVD VEQALSFFDK MVALHQDRWA ALGEDGSFKS 
EFRFQLHRLV IARQLARGEI QMLRVRAGER DVGYLYSFIR GKRLYVYQSG FDYTVLEKHG 
RPGLVTHTLA VQHNAALGFD VYDLMAGESQ YKSTISTVHE TLTWSVWRKP AIRFAVERQL 
RSAVGSYRRW RAARVDKASG PAQEEARQAA EEA