Gene Lcho_3335 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_3335
Symbol
ID	6160769
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	+
Start bp	3713767
End bp	3715191
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	74%
IMG OID	641666110
Product	peptidase M48 Ste24p
Protein accession	YP_001792358
Protein GI	171060009
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCCCC TCTTCAAGCC CGCCCGACCC GCCTTGCGCG CCTTCGCAGC GCGCCTGCAC 
GACGGCCGAC CGAACCGGCG CGACATCGGC CTGCTGTTCG GCAGCGCGGC GGGCTTGCTC 
GGCGGCTGCG CCAGCCCGGG CGGCGTGCCG CCGACCGGCG ACACGGCCGC ACCGGCTGCG 
CGGGCGACCC CGTCGGCATC GCCCGCAGCC CGGCCGCCGC CCAAGCCGGC CCCGATCGAC 
GACGCCGGCG CCCGCGCGCT CGACGCGCAG CAGGCGCCGC AGCAGTTCTC GCTCGACCTG 
GGCGCGCTGC AGGACGTGGC CATCAACACC TACGTCGGCG AGATCGGCTT CGCCATCCAG 
GCCCAGGCGC CGCGGCGTGG CCTGCCCTAC AGCTACCGCG CGCTCAACGC CCACCACCTG 
AACGCCTACG CCTTCCCGGC CGGCGGGCTG GGCATCACGC GCGGCCTGCT GATCGAGCTG 
CAGGACGAGG CCGAGCTCGC CGCGCTGATC GGCCAGCAGC TCGGCCACGT CAACGCCCGC 
CACGCACTGA GCCGCCAGCG CACCGATTCG GTGGCGCAGG CGGTGGTCAC GAACACCGTG 
GCGGCCAGCC AGGAATCGGC CTGGACGCCG CCGATCGGGC TGGCCGGACA GATCGGCGCC 
AGCGCGCTGA TCCCGACCTA CTCGGCCGAA CAGATGCGCG AGGCCGACGC GGCGGGGCTG 
CAGTACCTGG TCGGCGCGGG CTATCCGGGG CTCGGCATGG TGACGCTGCA GCAACGCCTG 
GCCGAAGCCG GGCAGCAGCG CCCGGCCCTG CTGGCGGCGA TGGCGGCGGC GCAGCCGACC 
AGCCCCGAGC GGCGTGACGC GGTGCGCCGC AACGTCGAGA CCCTGCACGC CGGCAGCCGC 
AACAGCAGCA CGCGCCGCGA GCGTTTCATG GACCGCACCG CCAGCCTGCG GCACATGCGC 
GCGCTGATCG AGGCCTGCAA GAACGGCGAA CTGGCGCTGG CCCGCAAGGA CCTGACCGAA 
GCGCACGCGC AGTTCAAGTC GGCGCTCGAG ATGGCGTCGC AGGACTACGC CGCCAACCTG 
CGCATGGCGC AGTGCCTGCA GGCGATGGGG CAGGTGCGCG AGGCGCGTGC ATTCGCGATC 
GCCGCGCGCG ACGCCTATCC GCAGGAGGCC CAGGCGCACA AGCTGGCCGC CACGCTGGCA 
CTGGCGCAGC GCGACGCCGC CGCCGCCTGG CAGGACCTCG AGGCGCATGA CCGCCTGCTG 
TCGGGCGACC CCGGCGTGGT GTTCCTGAAA GGCGTCACAC TTGAGCTCAT GGGACAAAGC 
AAACGCGCCG CCGAACACTA CCGCGCCTAC CTCGGCTACA CCGAACAGGG CCAGGCCGCC 
CAATACGCCG CCACCCGCCT GAAGCTGCTC GGTCATGACC GCTGA

Protein sequence

MDPLFKPARP ALRAFAARLH DGRPNRRDIG LLFGSAAGLL GGCASPGGVP PTGDTAAPAA 
RATPSASPAA RPPPKPAPID DAGARALDAQ QAPQQFSLDL GALQDVAINT YVGEIGFAIQ 
AQAPRRGLPY SYRALNAHHL NAYAFPAGGL GITRGLLIEL QDEAELAALI GQQLGHVNAR 
HALSRQRTDS VAQAVVTNTV AASQESAWTP PIGLAGQIGA SALIPTYSAE QMREADAAGL 
QYLVGAGYPG LGMVTLQQRL AEAGQQRPAL LAAMAAAQPT SPERRDAVRR NVETLHAGSR 
NSSTRRERFM DRTASLRHMR ALIEACKNGE LALARKDLTE AHAQFKSALE MASQDYAANL 
RMAQCLQAMG QVREARAFAI AARDAYPQEA QAHKLAATLA LAQRDAAAAW QDLEAHDRLL 
SGDPGVVFLK GVTLELMGQS KRAAEHYRAY LGYTEQGQAA QYAATRLKLL GHDR