Gene Acid345_0810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0810
Symbol
ID	4068689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1004249
End bp	1006093
Gene Length	1845 bp
Protein Length	614 aa
Translation table	11
GC content	62%
IMG OID	637982817
Product	TonB-like protein
Protein accession	YP_589889
Protein GI	94967841
COG category
COG ID
TIGRFAM ID	[TIGR01352] TonB family C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.904031
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATCCG GCACGCAGTT GAATTTAAGT CGCACGCCAG AGCCGAGTTC TACGGAACCC 
ACGCTCGCGC TTCTGCCTGC CATCGAATCC GGGCGCACCG TCTTCTTCCG CAACCTCGGC 
GACTTCCTCT GTTTCCGCGA TTGGCCTCGC CCTTTCGATC GCAGTCGGTA CGAAGGCTGG 
CTCACCAACT ACGTCCTGAC CGCGCCCGCA TGGACGCGCA TCCGCGAATC GTATTGGGGA 
CACGTCCTCG TCGTCGTCGC CACCTTCGCG ATCTGCACCT CTGCCTGGTT CCTTGAACCG 
CCCGTCAGGC CAATCAGCCC GTTTGAGCAC GCGCACATCC AGTACTACCC GACTTCCGAT 
TACCTGCCCG CAATCAACAG CAAGGCGCCG CGTCCGCACA CGTCGAAGAA AGCCGATCCG 
GTTTACGCGA AGCAGGAAAT CATCTCGGTA CGACCGAACG CCGACAATCA CACCCAGACC 
GTCATCACAC CACCAAACGT GAAGCTCCAG CACGATGTCC CGCTTCCCAA CATGGCGGTT 
TGGACGAGCG ACCCGGTCGC GCCTACTGCG GCTTCGCCTG CCGTGCAACC GAAGATGACC 
TTCCCACTCG CGGCCCAGGT CGTTGAGCCA ACTCCGGACA TCAGCAAACT CCGCGACAAG 
CGCACAATCA ACCTGCAAAG CTCAGCGGTC GAGCCGGTCG CGAACGATCG TACGCTGCGT 
CCCAACGGTC AACTCAACGT CTCGGCACTG CAACCTTCAG TCGTCGCGCC TGCGCCGTCG 
CTCCCTGTTC CCGCGCAACG CGCCAGCGGA CTCACCGTCG GCGAAGTCGT GCCACCCGCG 
CCCACTGTTT CCGCAAAGAA GAGTGGTGTG ACCGGAATCG GCAGCCTGCA ACCGCAAGCT 
ATACCCCCGG CACCAAATGC TCCGGGCATC GCCCAGCACG GGGTGCCGAA CGGAACCCCG 
CAGCCCCAAG TGGTTCCACC CCAACCCAGT GTCGGCGGCA TCGCCGGATC GAACGGCAAA 
CCAACTGGCC AGATCATCGC CCTCAGCGTT CACCCCACCG ACGTCCACGG TCCCATCAGC 
GTTCCCGCCG GTAATCGCAA CGGTGAATTC TCCGCTGGCC CCAGCGGCCG TCCCGGTGCC 
ACAGGACAGC CCGAATCTTC TGGAAACGAG AGCGGCCCTG GAGCAGGTAA GAACGGGAAC 
TCTAGTGGCG CTGGAAACGG CTCCGGGAAA GAGAACGGCC CTGCGGGCAT TTACGTCAGC 
GCGCCGCCCG AAGGCGCGAA TCCCGCGCCC GTCGTAGGCA AGACGCCGTC CCCCGCTCCC 
GCAACAACCG AGATGGCCAA GCTGCAGTTC CCCAAGATGC AGCACGCCAC TGTCGCCGAT 
CTCGCGAAAG CGACCAAGCC CATGCCCGCG ACAACCGCGC CCGAAGCGCG CAACCCGCTC 
GCTGACAAGG TTTTCGCCGG CAAGCGCTAC TACGCCCTTA CGCTCAACAT GCCGAACCTA 
AACTCTTCGA CCGGAAGCTG GGTGGTGCGC TTCGCCGAAC TCAACGATCG TCGCGATGGT 
ATCCCCGTGT TAGCGCCTGT CGCGACCAGC AAACTCGATC CGGTTTACCC GCAGGCACTT 
GTCCACTACC ACATCGAAGG CACGGTAACG CTCTACGCTG TCATCCGCCA GGACGGCACT 
GTCGCTGACA TCAAAGTTTT ACGCAGTCTC GACAAGGATC TCGACTACAG CGCGATGCGC 
GCCCTCGCGG GCTGGAGATT TGTTCCTGGA ATGAAGAATG GGACGGCGGT GGATTTAGAA 
GCGATCGTGG ATATCCCATT CCACTTGAAG CCGATCAACC CGTAG

Protein sequence

MASGTQLNLS RTPEPSSTEP TLALLPAIES GRTVFFRNLG DFLCFRDWPR PFDRSRYEGW 
LTNYVLTAPA WTRIRESYWG HVLVVVATFA ICTSAWFLEP PVRPISPFEH AHIQYYPTSD 
YLPAINSKAP RPHTSKKADP VYAKQEIISV RPNADNHTQT VITPPNVKLQ HDVPLPNMAV 
WTSDPVAPTA ASPAVQPKMT FPLAAQVVEP TPDISKLRDK RTINLQSSAV EPVANDRTLR 
PNGQLNVSAL QPSVVAPAPS LPVPAQRASG LTVGEVVPPA PTVSAKKSGV TGIGSLQPQA 
IPPAPNAPGI AQHGVPNGTP QPQVVPPQPS VGGIAGSNGK PTGQIIALSV HPTDVHGPIS 
VPAGNRNGEF SAGPSGRPGA TGQPESSGNE SGPGAGKNGN SSGAGNGSGK ENGPAGIYVS 
APPEGANPAP VVGKTPSPAP ATTEMAKLQF PKMQHATVAD LAKATKPMPA TTAPEARNPL 
ADKVFAGKRY YALTLNMPNL NSSTGSWVVR FAELNDRRDG IPVLAPVATS KLDPVYPQAL 
VHYHIEGTVT LYAVIRQDGT VADIKVLRSL DKDLDYSAMR ALAGWRFVPG MKNGTAVDLE 
AIVDIPFHLK PINP