Gene Lcho_0967 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_0967
Symbol
ID	6161476
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	+
Start bp	1033191
End bp	1034345
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	70%
IMG OID	641663718
Product	tetratricopeptide repeat protein
Protein accession	YP_001790004
Protein GI	171057655
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2956] Predicted N-acetylglucosaminyl transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	72
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTTTG ACCTGCAATG GCTGCTGCTG GGCCTGCCGG TGGCGTTCGC GCTCGGCTGG 
CTGGGCTCGC GCCTCGACCT GCGCCACCTC AGGCGCGAAA CCGAATCCTC GCCGCGGGCC 
TATTTCAAGG GCCTGAACCT GCTGCTCAAT GAACAGCAGG ACAAGGCCAT CGATGCCTTC 
ATCGAGGCGG TGCAGCAAGA CCCGGGCAGC ACCGACCTGC ACTTCGCGCT CGGCAACCTG 
TTCCGTCGCC GCGGTGAATA CGAACGCGCC GTGCGGGTCC ACCAGCACCT GCTGGCACGC 
GCCGATCTGC CCACCAGCGA GCGCGACCGC GCCCAGCATG CCCTCGCCCA GGATTACCTG 
AAAGCCGGCC TGTTCGACCG TGCCGAGGCG GCCTACAAGG CGCTCGAAGG GACGGCCTTC 
GCCACCGATG CGCGGCTGGC GTTGCTGACC TTGCACGAGT CCGCGCGGGA CTGGAAATCG 
GCCATCGAAG TGGCCCGCGG GCTCGAGGCC ACCGCTGCCG GCAGCTTTGC CCAGCGCATC 
GCCCACTACT GGTGCGAGCT GTGTCTGGAG GCCGATGCGG CGGGTGACGG CGCCGCCGCC 
GACGCCGCGC TGACCAAGGC GCGCGAAGTG GCCCCGCAGT CGGCACGGCC GCTGATCCTG 
TCGGGCCAGC GCCTGGCGCG TGCGGGCCGG CACACCGAGG CCCTGGGCCT GTGGACCGCG 
CTGTCGACCG TGCACCCGGA AGCCTTTTCA GTCATCGCCG GTGACTATGC CGCCAGCGCC 
CAGGTCTGCC AGCGTGCCGA CGAGGCGCTG GTCCGGCTCA AGGCCCTGCA TCTGGCGGCG 
CCCTCTGCCG ACCTGCTGCT GGCTGCGCTG AGCCTGGAGT CCGACGCCGC GGCGCGGCGC 
CGGATGCTGG TGCAGCACCT CAAGGAAAAT CAGAGCCTGA GCGCCGCACT CAAGCTGTTG 
CAGGACCCGG CCGCCGCGCC GGACGACGAT GGCGGCGAAA GCCTGGCCAT GCAGCAGGCC 
GTCGGCAAGG CCTTGCGCCC CTTGCGCCGC TACCACTGCG CGGCTTGCGG TTTCGAGGCA 
CAGAACTACT TCTGGCAATG CCCCGGCTGC CACGGCTGGG ACACCTATCC GCCGCGTCGA 
CTCGAGGACA TGTAG

Protein sequence

MDFDLQWLLL GLPVAFALGW LGSRLDLRHL RRETESSPRA YFKGLNLLLN EQQDKAIDAF 
IEAVQQDPGS TDLHFALGNL FRRRGEYERA VRVHQHLLAR ADLPTSERDR AQHALAQDYL 
KAGLFDRAEA AYKALEGTAF ATDARLALLT LHESARDWKS AIEVARGLEA TAAGSFAQRI 
AHYWCELCLE ADAAGDGAAA DAALTKAREV APQSARPLIL SGQRLARAGR HTEALGLWTA 
LSTVHPEAFS VIAGDYAASA QVCQRADEAL VRLKALHLAA PSADLLLAAL SLESDAAARR 
RMLVQHLKEN QSLSAALKLL QDPAAAPDDD GGESLAMQQA VGKALRPLRR YHCAACGFEA 
QNYFWQCPGC HGWDTYPPRR LEDM