Gene Acid345_1700 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1700
Symbol
ID	4070483
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2063208
End bp	2064461
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	60%
IMG OID	637983708
Product	secretion protein HlyD
Protein accession	YP_590775
Protein GI	94968727
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.696744
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.370784
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCCTA CTCGCAAGCG CGCGTTGCTC CTGCTCGGAG CGGCGTCACT GTGCGCTGCA 
ATTGCTTTTA CCTCATCCTC CTGTAGCTCC CATTCATCTT CGGTGGCGAG CGCCTCTAGT 
CCGCCGCGGG CCACGGTAGC GATCGCGAAG AAACAGCCGA TCGGAAATTC GATCTCGGTC 
GCAGGTGAAT TTCTCCCGTA CCAGGAAGTG GAAATCCACG CAAAAGTGGC TGGGTACATT 
CGGCACATAG GCGTGGATAT CGGGGACCGG GTACATACCG GGCAGGAGCT TGCGGTGCTC 
GAAGTGCCAG AGCTGACGGC GCAAGTCGAA GGTGCGAATG CCGGCATCAA ACGCAGCCAG 
CAGGAAATCA CACGGACAAA GCACCAGGAA GCGCAGGCTG AGGCCGATCA CCAAGCGCTG 
CATGCTGCAG CCATTCGACT GAAACAGGCG TCAGAGGCGC GACCGGGGCT GATTGCGGAG 
CAGGAGTTGG ATGACGCGAA TGCCAAGGAC CGCGCGTCGG AAGCGCAGGT CGAGGCGGCG 
AAGGCTGCAG TAGCGGCCTC GGAACAGGGA TTGGATGTAT CGCGTGCGTC GAAGAGCCAG 
GTCTCTGCGA TGTCGGATTA CTCACGCATC ACGGCCCCAT TCGACGGCGT GGTTACGTGG 
CGGTACTCCG ATACCGGGGC ACTGGTACAG GCAGGAACAT CAAGCAGTAG CGCCCAGCCT 
GTCGTGAAGC TGGCCGAGGT AAGGACGCTC CGGTTGCGGA TCCCAGTGCC GGAATCCGTG 
GTTCCGTCGA TTCACCAAGG ACAAACGGCC GACGTGGTGG TATCCGCGAC CAGTGAGCAC 
TTCACCGGCA GAGTGGCGCG ATATACGGAC TCGCTGGACA GAGCGACGCG CACTATGCAG 
GTCGAAATTG ACGTGCCAAA TCCGCAATAC AAGCTTTCGT CCGGCATGTA TGCCCAAGTC 
ACGCTACATA CGGACCAGAT CGCCGATGCG CTTAGCATCC CGGTGTTGGC TGTGCATCGT 
TCTGGAGACA AAGCAAGCGT CCTGGTGGTG AATTCCAGCG ATCGGATCGA GGAGCGCGCG 
ATCGCTATAG GTATCGAGGA ACCAAATTTC GTGCAGGTGC TCACGGGACT AAAAGAGGGT 
GAGCGCGTTG TTGTGGGGAA CGCGAGCGCG TACCAGGTCG GCGAATTGGT AAGTCCGAAA 
GAGAGCAGCG TTGCGACGGT GCTTACCTCC AGCACGCAAG GGGGTAGCGA GTAA

Protein sequence

MQPTRKRALL LLGAASLCAA IAFTSSSCSS HSSSVASASS PPRATVAIAK KQPIGNSISV 
AGEFLPYQEV EIHAKVAGYI RHIGVDIGDR VHTGQELAVL EVPELTAQVE GANAGIKRSQ 
QEITRTKHQE AQAEADHQAL HAAAIRLKQA SEARPGLIAE QELDDANAKD RASEAQVEAA 
KAAVAASEQG LDVSRASKSQ VSAMSDYSRI TAPFDGVVTW RYSDTGALVQ AGTSSSSAQP 
VVKLAEVRTL RLRIPVPESV VPSIHQGQTA DVVVSATSEH FTGRVARYTD SLDRATRTMQ 
VEIDVPNPQY KLSSGMYAQV TLHTDQIADA LSIPVLAVHR SGDKASVLVV NSSDRIEERA 
IAIGIEEPNF VQVLTGLKEG ERVVVGNASA YQVGELVSPK ESSVATVLTS STQGGSE