Gene Acid345_1621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1621
Symbol
ID	4072547
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1964961
End bp	1966184
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	59%
IMG OID	637983630
Product	secretion protein HlyD
Protein accession	YP_590697
Protein GI	94968649
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACCTG CTGACCTTTC AGCATTAAAA ATCGACGACA GCCACCGCAA CGCCAACCGT 
GGCGGAGTGT TTCGCTGGTT CGCCATCATT CTCGGGGTCC TCGTCATCGG CACCGGCGCC 
TTCTTCGCAT TGCAGAAGAA GCTCCCACCG GTTGAAGTCG TCTCGGCCCA CACCTCGGCC 
CCCGGTCAGG CACAGGCAGC CACGCTGCTC AATGCCAGCG GATACGTAAC CCCGCGTCGT 
CGCGCCACCG TCGCCGCCAA GATCACGGCT CGCGTCGAGC AAATTTACGC GGACGAAGGT 
ATGCGTGTGA AGGCGGGCCA GGTGCTCGCC ATCCTTGACC AATCGGATGC GCGCGTGCGA 
TTGAATTCGG CAGTCGCCGA TCGCGACAGC ACGCAAGCCC AACTCAGCGA TCTCCAGGTC 
AACCTCAAAA ACGCGGAAAT CGAACTCCAC CGCAACGAAG AGCTGCAAAA GAGTGGGGTC 
ACCACGCAGC AGGCCCTGGA TAACGCGCGC ACCACGGTCA ACAGCTACAA AGCCCGCATT 
GTGGCGACGC AGCAATCGAT TGCCGCTGCC GAGTCGCGAA TCAAAGTCGC ACAACAGGAC 
CTCGACAACT GCACCGTAGT CTCACCTTTC GATGGAATTG TGGTTTCCAA GGATGCGCAA 
CGCGGCGAAA TGGTGTCGCC GATTTCCGCG GGCGGTGGCT TTACCCGCAC CGGCATCGCG 
ACGGTAGTTG ACATGAACTC CAACGAGATC GAAGTGGACG TCAATGAGTC CTACATCGGC 
CGCGTGAAGG AAGGCCAACC GGTCATGGCC ACGCTCGACG CGTATCCCGA CTGGCAGATT 
CCTTCGCACG TGCGCACCAT CATTCCGACT GCCGACCGGC AGAAGGCAAC GGTAAAAGTG 
CGCATCTCGT TCGACAAACT GGATCCGCGC ATTCTTCCGG ACATGGGCGT AAAGGTCGCT 
TTCCTCGAAG ACAAGAAGGC AGACGACAAA GCCGCTTCAA AGCCGGCGAT GTTCCTGCCG 
AAAGATGCCG TGCACGATGA CGGTGGATCG AGTGTTGTCT ATGTCTTTAA GGATGGGAAG 
GCCGAACGTC GCGCCGTCCG TACTGGCGGA TCGCGTGGCG ACAATGAAGA GATTCTCGCG 
GGACTTACCG ACGGCGAACA GGTGATCGTT CGCGGACCCG CGGATTTACA TGATGGACAA 
ACCGTAGCAA TCAAACAGCA ATAG

Protein sequence

MSPADLSALK IDDSHRNANR GGVFRWFAII LGVLVIGTGA FFALQKKLPP VEVVSAHTSA 
PGQAQAATLL NASGYVTPRR RATVAAKITA RVEQIYADEG MRVKAGQVLA ILDQSDARVR 
LNSAVADRDS TQAQLSDLQV NLKNAEIELH RNEELQKSGV TTQQALDNAR TTVNSYKARI 
VATQQSIAAA ESRIKVAQQD LDNCTVVSPF DGIVVSKDAQ RGEMVSPISA GGGFTRTGIA 
TVVDMNSNEI EVDVNESYIG RVKEGQPVMA TLDAYPDWQI PSHVRTIIPT ADRQKATVKV 
RISFDKLDPR ILPDMGVKVA FLEDKKADDK AASKPAMFLP KDAVHDDGGS SVVYVFKDGK 
AERRAVRTGG SRGDNEEILA GLTDGEQVIV RGPADLHDGQ TVAIKQQ