Gene Lcho_4073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_4073
Symbol
ID	6162025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	-
Start bp	4566531
End bp	4567652
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	71%
IMG OID	641666851
Product	hypothetical protein
Protein accession	YP_001793090
Protein GI	171060741
COG category	[S] Function unknown
COG ID	[COG5351] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00000125532
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCCCATC CCGAACTCGT CAACCACACC GGCTTCGCCT TCGAAGCCCA GCTGCTGACC 
GACGAAGAAG GGGTGCCGCA GTTCGTCACC TGCGTGCAGG CCGTCTACAC GCTCGGCCCG 
GGCGGCGCCT TGCAGCTGAT CGAGCCACAA CCGCCGGTGT TACTCGGTGG CAAGTGGCGG 
GGTGACCCGG CCACCACCAG CCTGGTCAGC GAGCCGCAGA TCGCCTTCAT CAAGCCGGCC 
ACCGACGTGG TGCTGATCGG TCATGCCCTG CCCACGTCGG CCGACCGCAC CGAGGGCCTC 
GTGGGCCTGC GTGTCGGTCC GCTGCAAAAG ACCGTCAAGG TCTTCGGTGA CCGACGTGTC 
GTGCGGCGGC TGGGCCTGGC GATGATCGGC AGGCCCGCGC CCTTCGAGCG CCTGCCGCTG 
GTGTACGAGC GGGCCTTCGG TGGCTGGGAT CGCAGCGATG CCGACCCGGG CCAACACCGC 
CGGGAGGCGC GCAATCCCGT CGGCGTGGGC CTGCGGGCCC ACCTGAAGCC CGAAGAAGAA 
GCCTGGCTGC CCAACTTCGA GGATCCGCAG CACCTGATGG CTTCGGTCGA CGACACCCCT 
CCGCCGGCCG GTTTCGGTTT CATCGGCCCC GACTGGCAGC CGCGCCTGGG TCTTGCCGGC 
ACCTACGACG CCCTGTGGGT CAAGACGCGC CGGCCGCTGC TGCCGCGCGA CTTCGACCGT 
CGCTTCTTCA ACGCCGCCTC GCCGGGGCTG GTCGCCCCCG GCTACCTGAG GGGTGACGAA 
GTGGCGGTCG TGATCGGCAT GGCCCCCGAA GGCCGGGTCG ACTTCCGCCT GCCCGGCGGG 
CCTGCGCCCG CCTGCCGCAT CGGGCTGCGC GGGCGCCGGT GGCAGGCGCT GCAGACCGTG 
CTCGACACCG TCACCATCGA CCTCGACGCC CGCCGCGTCA CGCTGATGTG GCGCGCCCAC 
CTCGCCGTGC GCAACGGCCC GCACGACGTG CTGGCCATCG AACTGCACCC CGATGCGCAG 
GCCGCCGCCT GGCACGCCGC CGAGAAAGCC GCCGCACTCG CGCTGCTGAC ACGGGATGCG 
GCCGAAGAAG ACGCCGCTCC CACCGCGAAC GACGAGGCAT GA

Protein sequence

MPHPELVNHT GFAFEAQLLT DEEGVPQFVT CVQAVYTLGP GGALQLIEPQ PPVLLGGKWR 
GDPATTSLVS EPQIAFIKPA TDVVLIGHAL PTSADRTEGL VGLRVGPLQK TVKVFGDRRV 
VRRLGLAMIG RPAPFERLPL VYERAFGGWD RSDADPGQHR REARNPVGVG LRAHLKPEEE 
AWLPNFEDPQ HLMASVDDTP PPAGFGFIGP DWQPRLGLAG TYDALWVKTR RPLLPRDFDR 
RFFNAASPGL VAPGYLRGDE VAVVIGMAPE GRVDFRLPGG PAPACRIGLR GRRWQALQTV 
LDTVTIDLDA RRVTLMWRAH LAVRNGPHDV LAIELHPDAQ AAAWHAAEKA AALALLTRDA 
AEEDAAPTAN DEA