Gene Acid345_2818 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2818
Symbol
ID	4071821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3345053
End bp	3346183
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	62%
IMG OID	637984836
Product	secretion protein HlyD
Protein accession	YP_591893
Protein GI	94969845
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.68617
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAAAGT TCCCAATCAT TTCCACCGCA CTTCTTGCCG CTCTCGGCCT TGCAGTGCTC 
TCGGCTTGTG GCCGCTCCGC GCAGGGCGGT GCACCGCAGG GCTTCCCGGC GATGCACGTG 
CAAACACAGC CCGCGCTGGC GCAGAACGTC GGCGACTTCA CCGAGTATCT TGCCACGATT 
AAATCGCGCG GCTCATCCAT CCTCCAGCCC GAAGTCGAAG GTCAGATCAC GCAAATTTTT 
GTAAAGTCCG GCCAGCACGT TCAGCCCGGC CAAGTGCTGA TGGAAATCGA TCCCCGCCGT 
CAGGCCGCGA CTGTCAGTTC GCAGGAAGCC AACGCGAATT CCAAGCGCGC TAATCTCGAT 
TGGGCTTCCA AGGAACTCGA ACGTCGTAAG GGTCTCTATG CGGCGGGCGT CATCAGCCGA 
CAGGACCTCG ACCAGGCGCT GACCTCCTAC GACGCCGCCA AGGCCGACCT TACTGCCATG 
GATGAGACCG TCAAGCAGCA GAAAGTCCAG CTCCACTACT TCTCGGTCTA CGCTCCCACC 
GCCGGCATCG TTGGTGACAT CCCCGTTCGT GTCGGCGATC GCGTCACTGT CGCTACCGTG 
CTCACAACGC TCGACACCGG CGCCGGCCTC GAAGCCTATA TCTCCGTCCC CGCAGAAAAA 
TCGGCCGACG TGAAGCAAGG CATGCCCGTA ACCCTCGCTA CCTCCGATGG CAAGACCGTT 
GCGACCACGA TCTCTTTCAT CTCGCCGCGT GTCGATCCCG CGACTCAATT GCTCCTCGTG 
AAGGCCAACG TTCCCGCGAG CAGCGACTTC CGCAACGATC AAGTCATCCA CGCGCGCGTG 
ATCTGGAAAT CCGTCTCGCG TCCCACTCTG CCCGTCACCG CGGTTTCGCG CATCGGCGGA 
GCGACCTTCG CGTTCGTCGT TGGCGACAAC AAGGGCCAGG CCGTCGCTCA GCAGCGCTCG 
GTGCAACTCG GTGAGATCGT CGGCAACAGC TACACCGTGC TCGGCGGCAT CAGCCCCGGC 
GACAAGGTCA TCGTCAGCAG CGTCAACATG CTGGTGGACG GCATGCCCAT AGTTCCCGAA 
ACTGCCAGCC AGAATCCGGC TGCGCCATCT GCGGCAGGTC CGCAGTCCTA G

Protein sequence

MPKFPIISTA LLAALGLAVL SACGRSAQGG APQGFPAMHV QTQPALAQNV GDFTEYLATI 
KSRGSSILQP EVEGQITQIF VKSGQHVQPG QVLMEIDPRR QAATVSSQEA NANSKRANLD 
WASKELERRK GLYAAGVISR QDLDQALTSY DAAKADLTAM DETVKQQKVQ LHYFSVYAPT 
AGIVGDIPVR VGDRVTVATV LTTLDTGAGL EAYISVPAEK SADVKQGMPV TLATSDGKTV 
ATTISFISPR VDPATQLLLV KANVPASSDF RNDQVIHARV IWKSVSRPTL PVTAVSRIGG 
ATFAFVVGDN KGQAVAQQRS VQLGEIVGNS YTVLGGISPG DKVIVSSVNM LVDGMPIVPE 
TASQNPAAPS AAGPQS