Gene Lcho_0940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_0940
Symbol
ID	6160221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	+
Start bp	1004178
End bp	1005299
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	67%
IMG OID	641663691
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_001789977
Protein GI	171057628
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	120
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCCA AGCACAGCCC CCACGCCGCC GATCATTGGC CTGCACCCGT GGACAAGACC 
TCGCAGACCG ATGACGAAAG GATTGTTGAC GTGGTGCCAT TGCCTCCCCC CGAACACCTG 
ATCCGCTTCT TCCCGATCAG CGGAACGCCG GTCGAGACCC TGATCGGCCA GACCCGCCAC 
ACCATCCGCG AGATCCTGCA TGGCCGCGAC GACCGCCTGC TGGTGATCAT CGGCCCGTGC 
TCGATCCACG ACCCCGCCGC CGCGCTCGAA TACGCCCGCC GCCTGCTGCC GTTGCGCCAG 
AAATACGCCG GCACGCTGGA GGTGGTGATG CGCGTGTACT TCGAGAAACC GCGCACCACG 
GTCGGCTGGA AGGGCCTGAT CAACGACCCG TACCTCGATG AGAGCTACCG CATCGACGAG 
GGCCTGCGCA TCGCGCGTCA GCTGCTGCTC GACATCAACC GCCTGGGCAT GCCCGCCGGC 
AGCGAGTTCC TCGACACCAT CAGCCCGCAG TACATCGGCG ATCTGATCGC CTGGGGCGCG 
ATCGGCGCGC GCACCACCGA GAGCCAGGTG CACCGCGAAC TGGCCTCGGG CCTGTCGGCG 
CCGATCGGCT TCAAGAACGG CACCGACGGC AACATCAAGA TCGCCACCGA TGCGATCCAG 
GCTGCCGCCG GCGCGCACCA TTTCCTGTCG GTGCACAAGA ACGGCCAGGT GTCGATCGTC 
GAGACCCGCG GCAACAAGGA TTGCCACGTC ATCCTGCGCG GTGGCAAGGC GCCCAACTAC 
GACGCCGAGA GTGTCGCCGC CGCCTGCAAG GACCTGGCGG CGGCCAAGCT CGAGCAGCGT 
CTGATGGTCG ACTGCAGCCA CGCCAACAGC AGCAAGCAGC ACCAGCGCCA GATCGACGTG 
GCCCGCGACA TCGCCGCGCA GATGGCCGGC GGCAGCCGCT CGATCTTCGG CGTGATGGTC 
GAGAGCCACC TGGTGGCCGG CGCGCAGAAG TTCAGCCCCG GCAAGGACGA TCCGCGCAAC 
CTGGCCTTCG GCCAGAGCAT CACCGACGCC TGCATCGGCT GGGACGACTC GGAGCAGGTA 
CTGGAAATCC TGCATCAGGC GGTTCAGGCG CGCCGCGGCT GA

Protein sequence

MNAKHSPHAA DHWPAPVDKT SQTDDERIVD VVPLPPPEHL IRFFPISGTP VETLIGQTRH 
TIREILHGRD DRLLVIIGPC SIHDPAAALE YARRLLPLRQ KYAGTLEVVM RVYFEKPRTT 
VGWKGLINDP YLDESYRIDE GLRIARQLLL DINRLGMPAG SEFLDTISPQ YIGDLIAWGA 
IGARTTESQV HRELASGLSA PIGFKNGTDG NIKIATDAIQ AAAGAHHFLS VHKNGQVSIV 
ETRGNKDCHV ILRGGKAPNY DAESVAAACK DLAAAKLEQR LMVDCSHANS SKQHQRQIDV 
ARDIAAQMAG GSRSIFGVMV ESHLVAGAQK FSPGKDDPRN LAFGQSITDA CIGWDDSEQV 
LEILHQAVQA RRG