Gene Lcho_3469 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_3469
Symbol
ID	6159786
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	+
Start bp	3882930
End bp	3884231
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	69%
IMG OID	641666243
Product	integrase family protein
Protein accession	YP_001792490
Protein GI	171060141
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.0423889
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCGA CGAACAACCT CGACGACAAG AGCATCCGTG CCGCGATCAA GCGGGCGATG 
AAGGCGCAGG CCGGCGAGCG GCTGACCGAT GGCGATGGCT TGCGCCTGGA CGTGCAGCCG 
ACCGGTTCTG CCTGGTGGCG CTGGCGCTAC CGCTTCGGCG GGAAGGAGGG GATGCTGTCT 
CTCGGCACCT ACCCCGACAC GTCCCTGTCG GCAGCTCGCG GCAGGCGCGA CGAGGCGCGC 
GAGCGGCTGG CAGCCGGGAT CAACCCGAGC GAGGCGCGCA AGGATGACAA GGCGGCCCAG 
GCGCTGAAGG CTGAGGCTGC CCGCCTGGCC GCAGCGGGAT TGCCCGGGCC TGGCACGTTC 
GAGCACGCGG CCCGGGAGTG GCATGCCCGC ATGGCGCCGA GCTGGTCGGA AGGGCACGCT 
GGCAAGGTGC TGGCGCTACT GGTGAATGAC CTGTTCCCCT TCATCGGCAC GAGTGCGCTT 
GCCGAGCTGA CCCCGCCCGA GCTGTTGAAG CACGCTCGGC GCATCGAGGC CCGCGGTGCG 
GTCGAAACCG CATACCGGGC CCTGAAGGCG GCTGGCGCCG TGTTCCGCCA CGGCGTGCAG 
AACGGCTACT GCGACAGCGA CCCCACGCGA GACCTGAAGG GCGCCATCGT GCTGCCCGTA 
CCGGAGCATC GGGCTGCCAT CACCGACCCA GCCAGGTTGG GCGAACTGCT GCGGGCCATC 
GACGGATACC AAGGCACGCC GGTTGTACGC TCCGCTCTCG CGCTGGCGCC GCTGGTTTTC 
CTGCGACCGG GTGAGCTGCG CAAGGCCGAG TGGGCAGAGT TCGACCTCGA CGCAGCCGTG 
TGGACCATCC CGGCTGCGCG CATGAAGGGG CGGTTGAAAG CCAAGCTCAA CGGCCCCGAT 
CATGTGGTGC CGCTGGCGCC ACAGGCGGCG GCAATCCTGC GCGACCTGCA ACCGCTGACG 
GGTGCCGGCA AGTACGTGTT CCCGAATCCG CTCACGCCCG ACCGTCCGCT ATCCGACAAC 
GGTGTGCTGT CAGCGCTGCG CCGGATGGGC TTCGACAAGG ACGAGATGAC GGGCCACGGA 
TTCCGTGCCA CGGCGCGGAC CATCGCGGCC GAGCGGCTGA AGATCGACCC CGTGGTGCTC 
GAAGCGCAGC TTGCGCACGT AGTGGCCGAT GCGCTGGGCC GGGCCTACAA CCGTACGCAG 
TACCTCGACC AGCGCCGCGA CATGATGACC CGCTGGGCCG ACTACCTGGA CCGCCTGCGC 
AAGGGCGCAG AGGTGGTCGA CCTGACAAGC AAGCGGGCCT GA

Protein sequence

MAATNNLDDK SIRAAIKRAM KAQAGERLTD GDGLRLDVQP TGSAWWRWRY RFGGKEGMLS 
LGTYPDTSLS AARGRRDEAR ERLAAGINPS EARKDDKAAQ ALKAEAARLA AAGLPGPGTF 
EHAAREWHAR MAPSWSEGHA GKVLALLVND LFPFIGTSAL AELTPPELLK HARRIEARGA 
VETAYRALKA AGAVFRHGVQ NGYCDSDPTR DLKGAIVLPV PEHRAAITDP ARLGELLRAI 
DGYQGTPVVR SALALAPLVF LRPGELRKAE WAEFDLDAAV WTIPAARMKG RLKAKLNGPD 
HVVPLAPQAA AILRDLQPLT GAGKYVFPNP LTPDRPLSDN GVLSALRRMG FDKDEMTGHG 
FRATARTIAA ERLKIDPVVL EAQLAHVVAD ALGRAYNRTQ YLDQRRDMMT RWADYLDRLR 
KGAEVVDLTS KRA