Gene Lcho_0301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_0301
Symbol
ID	6161498
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	+
Start bp	317981
End bp	319852
Gene Length	1872 bp
Protein Length	623 aa
Translation table	11
GC content	71%
IMG OID	641663045
Product	polysaccharide biosynthesis protein CapD
Protein accession	YP_001789341
Protein GI	171056992
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1086] Predicted nucleoside-diphosphate sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	76
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTGGC AATCGCTCGA CAGCATCCTC ACCCGCATCC GCCCGCGCCG CGAAGTGCTC 
GCGCTGGCGA TCGACGCGCT GGTGGTGGCG GCCTGCTGGC ACATCACCTA CCTGTTCCGG 
CTCGGCTTCG AGCGCTGGCA CAGCGCCCGG CCGGATTACG ACGTCTGGGT CATGCTGGCG 
CTGGTGGCGC TGTATCTGGG CGTGTTCGTC GCCTTGCGCG TGCCCAAGGG CATGTGGCGC 
TTCTCGGGTT TCGGCGAGGT GCAGCGGCTC ACGTTGGCGT GTGCGATCGC CGGGCTGGTC 
GGCGCGGTGG CCGTGCTGAT GGCGCAGCTG TCGCAGGTGC CGCGCGCGGT GCTGGCGCTG 
CACCCGGTCG TCAGCCTGAT GGGGCTGGCG ATGGTGCGCA TCGGCTACCG CATGTTGTAC 
GAACACATGC GTGGGCGCAT CTCCGGCAGC GCCACCGAAA CCCGCCGCGC GCTGGTGATG 
GGCGCGGGCG ACGCGGCGCG GCTCTTGATC GCCGGCATCC AGCACCACGG CTGGGTGGTG 
GTCGGCCTGC TCGACGACGA TCGGCGGCGC CTGGGCACAC GCGTCAGCAA CGTGCCGGTG 
CTCGGGCCGC TGGACAGTGC GCCGCGCTGG GCCGAGCTGC ACGGCATCAG CCACATCATC 
GTCGCGCTGC CGTCGGCCAC GCCGGCCGAA CGCCGCCGCG CGCTCGACCT GGCCGCCGCC 
ACCCATCTGC CGGTGGTGAC GGTGCCCAGC GCCGCCGAGC TGCGCGAGGG AACCACGGTG 
ACGCGGGTGC GCGAGATCGA GGCCGAAGAC CTGCTCGGCC GCGAGCCGGT GCAGCTCGAC 
GAAGGCGGCA TCAGCGAGGC GCTGGGTGGC AAGGTGGTGC TGATCACCGG CGCGGGCGGT 
TCGATCGGCT CGGAGCTGTG CCGCCAGGTG GCGCGTTACG GCCCGCTCAA GCTGGTGCTC 
TACGAGCTGA GCGAGTTCGC GCTCTACCGC ATCGAGCAGG AGCTGAGCGA GCACTTCCCG 
CATATCCCGC TGGTGCGGCT GGTGGGCGAC GTGCGCGACC CGGAGCACCT GCGCGCCACC 
TTCACACGCG TGCGCCCGCA GGTGGTGTTC CACGCCGCGG CCTACAAGCA CGTGCCGCTG 
ATGGAGGAGG ACAACGCCTT CGCCGCCTTG CGCAACAACA CGCTCGGCAC CTGGCGCGCA 
GCCAGCGCGG CGGCCGAGGC GGGCGCCGAA CGTTTCGTGC TGATCTCGAC CGACAAGGCC 
GTCAACCCGA CCAACGTGAT GGGCGCGAGC AAACGCGCGG CCGAGATGGT GATCGCCAAG 
CTCGCGGCCG AGGTGCTGGC GCGCGGCGGG CGCACGCGTT TCATGGCGGT GCGTTTTGGC 
AATGTGCTGG GTTCGTCGGG CAGCGTGATC CCGAAGTTCA AGGAGCAGAT CGCCCGCGGC 
GGGCCGGTGA CGGTGACACA CCCCGACATC ACGCGCTTCT TCATGACCAT CCCCGAGGCT 
GCGCGACTGG TGGTGCAGGC CGCGGCGATC GGCGAGGGCG GTCAGGTGTT CGTGCTCGAC 
ATGGGCGAGC CGGTGCGCAT CGTCGACCTG GCGCGCGACC TGATCCGCAT GAGCGGCCAT 
TCGGCCGACG AGATCCCGAT CACCTTCAGC GGCCTGCGCC CGGGCGAAAA GCTCTACGAA 
GAACTGCTGG CCGACGCCGA CGCGACGCTT GCGACGCGCT TCGAGCGCCT GCGCATCGCC 
CGCCTCGACG ACCGCGGCCA CGACGTGCAG GCATTGCTCG ACTGGGCCGC CGAGCGCAGC 
AGCGCGCCCG ACGACGAAGT GCGCGAACGG CTGGCGCGGC TGGTGTCGGA ATACCGCCGC 
GCCGGGCATT GA

Protein sequence

MIWQSLDSIL TRIRPRREVL ALAIDALVVA ACWHITYLFR LGFERWHSAR PDYDVWVMLA 
LVALYLGVFV ALRVPKGMWR FSGFGEVQRL TLACAIAGLV GAVAVLMAQL SQVPRAVLAL 
HPVVSLMGLA MVRIGYRMLY EHMRGRISGS ATETRRALVM GAGDAARLLI AGIQHHGWVV 
VGLLDDDRRR LGTRVSNVPV LGPLDSAPRW AELHGISHII VALPSATPAE RRRALDLAAA 
THLPVVTVPS AAELREGTTV TRVREIEAED LLGREPVQLD EGGISEALGG KVVLITGAGG 
SIGSELCRQV ARYGPLKLVL YELSEFALYR IEQELSEHFP HIPLVRLVGD VRDPEHLRAT 
FTRVRPQVVF HAAAYKHVPL MEEDNAFAAL RNNTLGTWRA ASAAAEAGAE RFVLISTDKA 
VNPTNVMGAS KRAAEMVIAK LAAEVLARGG RTRFMAVRFG NVLGSSGSVI PKFKEQIARG 
GPVTVTHPDI TRFFMTIPEA ARLVVQAAAI GEGGQVFVLD MGEPVRIVDL ARDLIRMSGH 
SADEIPITFS GLRPGEKLYE ELLADADATL ATRFERLRIA RLDDRGHDVQ ALLDWAAERS 
SAPDDEVRER LARLVSEYRR AGH