Gene Acid345_0954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0954
Symbol
ID	4070836
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	1213617
End bp	1214696
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	63%
IMG OID	637982961
Product	hypothetical protein
Protein accession	YP_590031
Protein GI	94967983
COG category	[R] General function prediction only
COG ID	[COG0701] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.416811
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCGA GCGCCTCTGC CGCACCCGCT TTTGCTGTCG CCGATGTCCC GAAGAAATCT 
GCTGTCACCA CTGCGCAGAT CGTTACCGTC ATCTTCCTCG GCCTCGCCAT GGCGCTCTAT 
TTCTGGGTTG ATTCGCGATA CCCCTCATTG ATGAAGAAGT ACCACGCCGG CCACGCGGTG 
AAGGCTGCGG GCGCCATCAG CTTCGACGCG ATCCTTCCCG TCAACCCAAC CATGCCGCTG 
ACGACACGCA TCGTGCGTAC CTCCGGCAAT TGGCTCTATA CGAACCGCAT CGGGATGAGC 
TTCGGTATGG GGTTCGGCGC GTTGCTGCTC ACGCTCCTGC CCATGTTCGC GCGCCGCCGG 
TTCAAAAGCG GATTTGCCAA TACCGTGCTC GGCGTCGCAG CGGGTGCGCC GCTCGGCGTG 
TGCGCCAATT GCGTCGCGCC CATCGGACGC GGCCTGGTGC AGGCCGGCGC TAGTCCCAAC 
ACCGCGCTCG CGACCATGAT CAGTTCGCCC ACGCTTAACG TTGTCGTGCT GGCGATGGCA 
TTCAGCCTGT TCCCGCTGCC GGTTGCCATC ACCAAGATTG CGACCGTGCT CGCGCTGCTC 
GCGCTGGTGC CGTGGTTTGC GCCAAAGCCC GAGCCGGAAT TCGCCTGTGA GATTCCGCAA 
TCGGCAGCCG CCGGATCGGC CGTAGTGCTC TTCCTCAAGA ACCTTGCGAA GATGATCGCG 
ATCACGCTGC CGTTCATGGT GCTCGCCGGC GTTCTCGGCG CAATCCTCGC CGAAGCCCTG 
CCATCGAGCA GCCTGCCCGC GCACGTTTCG ATTCTCGGAA TCATTCTTGT CGCGCTGATC 
GGCGCATTCC TGCCGGTACC GATGGCTTTC GACGTCGCAA TCGCGTTCGT ACTGATGTCG 
CGCGGGGTGG CGCTGCCCTA TGTCGTGACG CTACTCTGCA CCCTCGGCTG CTTCAGCATT 
TATTCGGCGC TGATCGTGGG CAAGAGCCTG TCGTGGAAGA CCGCCGGCAA GATGTACGGC 
ACGGTGGCCG CGCTGGGAAT CGTCGCGGGA TTGGTGACCG CGGCGTGGAG CGGATTCTAG

Protein sequence

MSSSASAAPA FAVADVPKKS AVTTAQIVTV IFLGLAMALY FWVDSRYPSL MKKYHAGHAV 
KAAGAISFDA ILPVNPTMPL TTRIVRTSGN WLYTNRIGMS FGMGFGALLL TLLPMFARRR 
FKSGFANTVL GVAAGAPLGV CANCVAPIGR GLVQAGASPN TALATMISSP TLNVVVLAMA 
FSLFPLPVAI TKIATVLALL ALVPWFAPKP EPEFACEIPQ SAAAGSAVVL FLKNLAKMIA 
ITLPFMVLAG VLGAILAEAL PSSSLPAHVS ILGIILVALI GAFLPVPMAF DVAIAFVLMS 
RGVALPYVVT LLCTLGCFSI YSALIVGKSL SWKTAGKMYG TVAALGIVAG LVTAAWSGF