Gene Acid345_4517 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4517
Symbol
ID	4070195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	5359359
End bp	5360438
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	55%
IMG OID	637986556
Product	hypothetical protein
Protein accession	YP_593591
Protein GI	94971543
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1463] ABC-type transport system involved in resistance to organic solvents, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCTAGTC AGAAACAAGT CCGTTGGGCG CAACTTCGCG TAGGCATTAC GGTTATCTTT 
GCGACAGCTA CGCTTTGCGT CCTGATCTTC CTGATGTCGG GGACCTCCGG CATCTTCACC 
CGGAAGGTAA CGCTCGTGGT TTATCAGGAC AACGCTGGCG GCCTGCGCAT TGGCGCACCG 
GTTCGCCTGC AGGGCGTGGA CATTGGCAAT GTCACCAGCA TCGGCGTGGT GACCGATCCG 
AATCATCCAG CCGATCCTGT CCAGATCAAG TTCAAGATCT CCAGCAAGTT CCAGCCGCTC 
GTCCATCTCG ATGCCACGGC GACGCTTGCG ACCGCTGGTG TTTTGGGCGA GACGTTTGTA 
GACATCGATA GCCGCCAAAC AAAGGACCGC ATGGTTAAAG ATGGCGACAT TCTCAAGTCG 
AAAGATGAGC CTTCATTTAA TGATGTCGTG AAATCCACCC AAGGCACCCT GCAAAACGTA 
GATGTTCTCT TGCAGCGCGC CGACCGCATT TTTGCCTTCA TCGAAAGCGG CCAGGGCTCC 
ATCGGCAAGT TGATCTACGA CCAGGAACTG TATAACCGCC TGAATTCCAC GCTCAACGAA 
GTACAAGCGA TGGTTAACCA GATCAGCTCA GGCAAGGGCT CGATCGGCAA ACTGATCAAC 
GATGACGAGC TTTACAACAA AGCGAACGCG TCCGTCGATA AGCTCGCCAA GATCATCGAC 
GAGATAGACA AAGGCGAAGG CACCATTGGC AAGCTGCTGA AGGACCCTAG CCTGTATAAC 
AACGCTAACG AGACGATCAC GAAGGCGAAT TCGTTGATCG GCGACATCAA CCAGGGCAAG 
GGCGCGCTCG GCAAGTTCGC GAAAGACGAA GCGTTCGCGA AGAAGCTCGA CGATACGATG 
TCGCATCTCG CAAGTATTTC CGCCAAGATC GACAATGGCG AGGGCAGCGT CGGCAAGCTG 
ATGAATGACC CAGCGCTGTA TAACAACACC GATCAGGCCC TCGTCGAAAC GAGGCACCTG 
TTGCAGGCCA TTCGTGAGAA CCCGAAGAAG TACCTCACCT TCCACGTGAA GGTCTTCTAA

Protein sequence

MPSQKQVRWA QLRVGITVIF ATATLCVLIF LMSGTSGIFT RKVTLVVYQD NAGGLRIGAP 
VRLQGVDIGN VTSIGVVTDP NHPADPVQIK FKISSKFQPL VHLDATATLA TAGVLGETFV 
DIDSRQTKDR MVKDGDILKS KDEPSFNDVV KSTQGTLQNV DVLLQRADRI FAFIESGQGS 
IGKLIYDQEL YNRLNSTLNE VQAMVNQISS GKGSIGKLIN DDELYNKANA SVDKLAKIID 
EIDKGEGTIG KLLKDPSLYN NANETITKAN SLIGDINQGK GALGKFAKDE AFAKKLDDTM 
SHLASISAKI DNGEGSVGKL MNDPALYNNT DQALVETRHL LQAIRENPKK YLTFHVKVF