Gene Lcho_2988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_2988
Symbol
ID	6162642
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	+
Start bp	3290684
End bp	3292486
Gene Length	1803 bp
Protein Length	600 aa
Translation table	11
GC content	67%
IMG OID	641665765
Product	peptidase U35 phage prohead HK97
Protein accession	YP_001792015
Protein GI	171059666
COG category
COG ID
TIGRFAM ID	[TIGR01543] phage prohead protease, HK97 family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	90
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCGCA CTGAGCTGGT CAACCGCTCT GCCACCTTCG AGCGGGCGCT GGTCGACCTG 
GCCGCGCGGA CCGTGCCGGT TTCGTTGTCC AGCGAACGGC CAGTGATGCG TTACGGCGAG 
TTGGAGGTTC TGCGCCACGA ACCCCAGTGC ATCGACCTGA GCCGCGCCAT CGGGGGCTTG 
CCGCTGCTGT ACTGCCACGA CCACGCCCAG CCTGTCGGCG TGGTCGAGAA CGTGCGCCTC 
GATGGCCGGC GCCTGGTCGG CACCGCACGC TTCGGCCAGT CGGAGAAGGC CCAGGAGGTC 
TTCCAAGACG TGCGCGACGG CTTGTTGCGC GGCATCTCGG TGGGCTACCG CATCAACGCC 
ACCGAACCCA TTCTCGGCGG CATTGCCGCC ACCTCGTGGA CGCCCTACGA GGCGTCCGTC 
TTGGCCGTTC CTGAAGATTC AACCGTCGGT ATCGGCCGCA GCGCTGGCCA ACTCCAAACC 
CCTGAAGGGA ATTCCCCCAT GCCCGCAAAC ACCCTCGACC TGCACACCCG CGCAGCTGCC 
CCCAACGAAG TGCGCGAGCT GGTCAAGCTC CACGGCCTCA ACGCCAGCGT GGCCGATGGC 
CTGATCCAGC GCGGCGCCAC CCTGGACGCG GTGCGCGCCC ACGTCCTGGA CGCCCTGGCG 
TCGAGCGACC GGGCCTCGGG TGGCCACCTG AACACGACCT CCAACGGCAT GGAGTACCAC 
GGCCGCAGCC TGGCCAGCAT CGGCCACGAA ATCCACGGTC CGCAGGTTGA GCAGATGCAA 
GAGGCCCTGG TGGCTCGGAT GGGCGGCCCG GCCGCCAAGA CCGGCAACCA GTACCGCCAC 
GCCCGCATGG CCGACATGGC GCGCGACCTG CTGGAGCATC GCGGCCTTCG CACAACGTCG 
ATGGCACCGC GCGAGCTGGT CGAGCGGGCG TTGCATACCA CGAGCGACTT TGCGGGCCTG 
TTGCAGGGCG CTGGAAATCG GCTGCTGCGC CAGGGCTACG AGTCGGCCCC CAGCATCAAG 
CGGGTGTTCA AGGCCAGCAC CGTGGCCGAT TTCCGCGCCA AGCAGAAGCT GAACTTGGGC 
GAAGCGCCAG CCCTGCTGAA GGTCAACGAA CACGGGGAGT TCAAGAGCGG CTCCATGGCC 
GACACGACCT CGAGCTACAG CCTGGCCACA TTCGGCCGCA TCTTCGGCAT CTCGCGCCAG 
GCACTCGTGA ACGACGACCT GAACGCCTTC GGCGACATGT CCGTGCGCTT GGGTAAGGCG 
TCGGCCGAAT TCGAAAATCA GTTCCTCGTG GATCTGCTGA CCAGCAATCC CTCGATGTAC 
GACGGCACCG CGCTGTTCCA CGCCGCCCAC GGGAACCTGG CCACCGGCGC AGGCTCTGCG 
CTACAGCTGT CCGCTCTGAC GGTGGCCCGC CAGGCGATGC GACTGCAGAA AGGCCTGGAC 
GGCAAAACGC CGATCGATGC TTCCCCGCGT TACCTGGTGG TGCCGGCTGC ACTGGAAACG 
ACCGCCGAGC AGTTGGTGAG CGCCATCACA CCGAACCAGT CTTCCAGCGT CAATCCGTTC 
GCCGGCCGGC TGGAGTTGGT GGTAGATCCG CGCCTCGATG CGGTGTCTCC GACGGCCTGG 
TATCTGGCCG CCGATTCGGC CGTGATCGAG ACGATCGAGT ACGGCTACCT GGACTCGGCC 
AACGGCCCGG AGATCTTCAC CGAAGAAGGC TTCGAAATCG ACGGCCTGCA CATGAAGGTT 
CGCCTCGACT TCGGCGGCGG TGTGATCGAC TGGCGCGGCC TCTACAAGTC CGTAGGCGCC 
TGA

Protein sequence

MSRTELVNRS ATFERALVDL AARTVPVSLS SERPVMRYGE LEVLRHEPQC IDLSRAIGGL 
PLLYCHDHAQ PVGVVENVRL DGRRLVGTAR FGQSEKAQEV FQDVRDGLLR GISVGYRINA 
TEPILGGIAA TSWTPYEASV LAVPEDSTVG IGRSAGQLQT PEGNSPMPAN TLDLHTRAAA 
PNEVRELVKL HGLNASVADG LIQRGATLDA VRAHVLDALA SSDRASGGHL NTTSNGMEYH 
GRSLASIGHE IHGPQVEQMQ EALVARMGGP AAKTGNQYRH ARMADMARDL LEHRGLRTTS 
MAPRELVERA LHTTSDFAGL LQGAGNRLLR QGYESAPSIK RVFKASTVAD FRAKQKLNLG 
EAPALLKVNE HGEFKSGSMA DTTSSYSLAT FGRIFGISRQ ALVNDDLNAF GDMSVRLGKA 
SAEFENQFLV DLLTSNPSMY DGTALFHAAH GNLATGAGSA LQLSALTVAR QAMRLQKGLD 
GKTPIDASPR YLVVPAALET TAEQLVSAIT PNQSSSVNPF AGRLELVVDP RLDAVSPTAW 
YLAADSAVIE TIEYGYLDSA NGPEIFTEEG FEIDGLHMKV RLDFGGGVID WRGLYKSVGA