Gene Acid345_3133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3133
Symbol
ID	4070248
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3725814
End bp	3726842
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	66%
IMG OID	637985153
Product	TonB-like protein
Protein accession	YP_592208
Protein GI	94970160
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0810] Periplasmic protein TonB, links inner and outer membranes
TIGRFAM ID	[TIGR01352] TonB family C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.162217
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTAGCG CCGCCCTGTA CGACCAACTC GACCAAGCCG TGGAGCGCAT TCTCACCGGC 
GACCAACTCG CCGTCGAAGA ATTCGACCCG CTCGTTCGCG AACTGCTTCC CATCGCCGAC 
GATTTGCACG TCGCGCCTCG CCCCGACTTC CGCGCGTCGT TGCGAGCCGA ACTTGAACGC 
CCGCGCCGTA GCGAGGTGAT CCCTATCGCG CCCGCCGTCC TGCCTTTCCT GTTCGCCGAG 
CACGCTTCGA TGAGGCGCAG CCCGTTCGGC GCCTCGGCCG CACTGCACGC CGCGGCGTTT 
CTGCTCATCG CAACTTCGAG CCTCTGGATG GCGCAACATC CCGTCGCGAA AAAACAAACC 
ACCGCGCTGC TCACCGATGT CGGTACCTTC ACGCTGCCGC CGTCGAAGAC CATCGCTGGC 
GGAGGTGGTG GAGGCGGAGA TCGCGACAAG TTCGACGCCT CTCGCGGCGA CGCACCGCGC 
TTCGCCCGCG AGCAGATCAC GCCACCTGCC ATCGTCGTGC GCAATGAAGC CCCGAAACTT 
GCGGTTGATC CGACCGTAGT CGGTCCGCCG GACGTAAAGC TCTCGAATCT CGGCGTAACC 
GGCGACCCGC TTTCGAAGAT GCTGAGCGCC TCGAACGGCA CCGGCGCGGG CGGCGGGATT 
GGCAGCGGCT ACGGTGGCGG CGTCGGTTCT GGCTATGGTC CTGGCGTCGG GCCGGGCTGG 
GGCGGGGGGT ACGGGGGAGG GGTGTATCGG GTAGGCAGCG GCGTCAGCGC ACCGCGGGCG 
ATCTACGCAC CCGACCCGCA ATACTCCGAA GAAGCCCGCA AAGCCAAGAT GCAAGGCGTA 
GTGGTCCTCG CACTCGTAGT CGGCGCCGAT GGCCGCACCC ACGACGTCAA AATCGCCCGC 
ACCCTGGGCA TGGGCCTCGA CGAGAAAGCC ATCGAAGCAG TAAAGACCTG GAAGTTCGAG 
CCCGCCCTCA AAGACGGCCA CCCCGTCTCT GTCCTGGTCA GCGTCGAAGT CAACTTCCAC 
CTCTACTAA

Protein sequence

MSSAALYDQL DQAVERILTG DQLAVEEFDP LVRELLPIAD DLHVAPRPDF RASLRAELER 
PRRSEVIPIA PAVLPFLFAE HASMRRSPFG ASAALHAAAF LLIATSSLWM AQHPVAKKQT 
TALLTDVGTF TLPPSKTIAG GGGGGGDRDK FDASRGDAPR FAREQITPPA IVVRNEAPKL 
AVDPTVVGPP DVKLSNLGVT GDPLSKMLSA SNGTGAGGGI GSGYGGGVGS GYGPGVGPGW 
GGGYGGGVYR VGSGVSAPRA IYAPDPQYSE EARKAKMQGV VVLALVVGAD GRTHDVKIAR 
TLGMGLDEKA IEAVKTWKFE PALKDGHPVS VLVSVEVNFH LY