Gene Acid345_4070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4070
Symbol
ID	4072492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4816746
End bp	4817963
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	60%
IMG OID	637986101
Product	secretion protein HlyD
Protein accession	YP_593144
Protein GI	94971096
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.409958
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.154431
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACTCG AACCTGAGCG TTCCATTCGT CTCGCTCGCG AAATTCAACC ATTCAGAAAA 
GCCGCACTCA CGCGGCTGGG CTTCGGTGCG GCAATCCCGA CTCTATTGCT GGTGCTCACT 
CTCGGGTGCG ACAAGAAAGA GGAGGCAGTT GCTCCGCCTC CACCCGACGT GCAAGTGACC 
GGCGTCGTGC AGCAGGACGT GCCCCTGTAT GGCGAGTGGG TCGCCACCCT CGATGGTTTT 
GTGAACGCAC AGATCGCGCC ACAAGTCAGC GGCTACCTGA TGAAACAGAA CTACCGAGAG 
GGTTCGGTGG TGAAAAAAGG CGACGTGCTC TTCGAGATCG ACCCACGGCC CTTTGAAGCC 
GCGCTCGACC AGGCAAAGGG CAATTTCGCC GAAACCCAAG CCAAGCTCGG CAAGACTGAG 
CTCGACGTAA AGCGCGACAC GCCACTGGCG GCGCAGAGCG CGATTCCGCA AGCGCAACTC 
GACAACGACA TTCAAGCGAA CGAAGCCGCG AAAGCCATGA TCGTGGCGTC GCAAGCACAA 
GTGCAGCAAG CGGAGTTGAA CGTCGGCTTC ACCAAAGTCC GCTCGCTGGT GGACGGAATC 
GCCGGACTCG CAAAAGGACA GATTGGCGAC CTCGTCGGCC CGACAACGAT CCTCACCACC 
GTTTCGCAAG TTTCGCCGAT CAAGGCTTAC GTCTCGATCA GTGAGCAGGA ATACCTTCGC 
GCCGCGCAAA GAATCAGCAT GGTGTCTTCC GGACAACTCA GCCTCGACAA GATGCCGAGG 
AACCTCGAAC TGATCCTCTC CGATGGCACG ACCTACAAAT ACAAGGGCTA CTTCGTGGTT 
GCCGATCGCC AGGTTGATCT CAAGACCGGC ACGATTCGTC TCGCCGCTGC TTTCGACAAT 
CCAGAAGGCA TCCTTCGGCC AGGACAATTC GCGCGCCTAC GCGTTGAAAC CCGTGTTGCG 
AAGGACGCGC TCCTCGTCCC GCAGCGCGCG GTCGTCGAGA CCCAGGGCTC GTACAGCGTC 
GTCGTTGTCG GTTCCGACAG CAAGGCAAGC ATTCGCCCGG TAAAGACCGG CGAGCGCGTC 
GGCGAGTTGT GGATCATCAC CGAGGGCCTC AAGCCAGGCG AACAGGTCAT CGTCGAAGGC 
ATGCAGAAAG CGAAGGAAGG CAGCCCGGTC AAAGCGGTAC AGGCGCAAGC GGAACCCACC 
AAGGCCCAAG GAGACTAA

Protein sequence

MSLEPERSIR LAREIQPFRK AALTRLGFGA AIPTLLLVLT LGCDKKEEAV APPPPDVQVT 
GVVQQDVPLY GEWVATLDGF VNAQIAPQVS GYLMKQNYRE GSVVKKGDVL FEIDPRPFEA 
ALDQAKGNFA ETQAKLGKTE LDVKRDTPLA AQSAIPQAQL DNDIQANEAA KAMIVASQAQ 
VQQAELNVGF TKVRSLVDGI AGLAKGQIGD LVGPTTILTT VSQVSPIKAY VSISEQEYLR 
AAQRISMVSS GQLSLDKMPR NLELILSDGT TYKYKGYFVV ADRQVDLKTG TIRLAAAFDN 
PEGILRPGQF ARLRVETRVA KDALLVPQRA VVETQGSYSV VVVGSDSKAS IRPVKTGERV 
GELWIITEGL KPGEQVIVEG MQKAKEGSPV KAVQAQAEPT KAQGD