Gene Acid345_0863 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0863
Symbol
ID	4068957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1074697
End bp	1076325
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	58%
IMG OID	637982872
Product	phage tail sheath protein
Protein accession	YP_589942
Protein GI	94967894
COG category	[R] General function prediction only
COG ID	[COG3497] Phage tail sheath protein FI
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00698739
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCGA CTTTCACGTT TCCTGGCGTT TACATTGAAG AAATTCCCAG TGGAGTGCAC 
ACCATCACAG GCGTCGCTAC CTCCATCGCT GCCTTCGTGG GCTGGGCAGC GCAGGGCCCG 
ACCGATGAAG CCACACTGGT CCAGAGTTGG GCAGACTTCG CGAACCAATT CGGCGGCCTC 
GACGCCCGAA GCAATCTCGG CTACTCCGTC AATCAGTTTT TTAACAACGG CGGACAACAG 
GCCTACATCG TGCGACTCGT CTCCGACACC ACGAACGGCA ACACGGCGGC TGCGACGGCG 
TCGGTCAACA TCAAGACCAT AACCTTCGAC GCGAGCGTGT CACCCAGCAA AGTCACCGTT 
ACGAAAGGTG CCGCCGGATT GACAATATCG GCCGCAAACC AAGGCGCATG GGCGAAGAAC 
TACTCCATCC AGGTCCAGCC GCGAATTGAC GATTACAACC GCTTTACTCT CTCGGTTGTC 
TACACCGATC CCGTCACGTC TGCGCAGACC ATTGTTGAGA GCTATTCGAA TCTCTCGACG 
AACTCTGCCG ACACGCAGGG ACGCTACGTC GTCAACATCC TGAACGAACA GTCGAACTAT 
GTAACGGCGA AGATGGCCCC AACCCCGGTC ACGCTGACCG TCACTCCCGG CGTTCCGACC 
ACGCCGAAAG CCTCGAATCC CGGCTCTATC GCATTGAATG CCAGCGTTGA CGGAAACGAC 
GGCACGCCGC TGGCACCGGG CGACACCGTC TTCGAGAAAA TGCTCAATTC GGGCGGAGCC 
GGAACCGCAG GTGTTCGGTT GCTCGATACC GTTCCCATCT TCAACATCCT TTGCGTTCCC 
GGCGAAACGG TGGTCCAGAA CATCACCGAA CTGCAAGCGT ACTGCGTGGA CAACCGCGCA 
TTCCTAATCG TAGATTCCAA GTCGGACGAC AAGGTGAAAG ACCTGGCACT AAACGGTCCG 
GCTGGCATTA CTGGCGTAAA CTCCATCAAC TCCGCGCTCT ACTTTCCGTG GGTCAACCAG 
TTCGACTCGC AAACCAATAG CACTCGCGCC TTTCCACCCT GCGGCTTTGT TGCGGGCCTC 
TATGCGGCGA CTGACACAGC CCGCGGGGTT TGGAAAGCGC CTGCCGGCAT CGACGCCAGC 
CTCACTGGTG ACACCGGTCT CACGCTCAAT CTCACGAACG CGCAGAACGG AAGCTTAAAT 
ATCCAGGCGA TCAATTGCCT CCGCAACTTT CCTGTGTACG GCGACGTCAT TTGGGGTGCG 
CGAACGTTGC GCGGGAACAA CCAGGTCGGC TCCGAGTGGA AGTACGTTCC CATCCGGCGT 
CTCGCTCTCT TCCTCGAAAG CTCGTTGTAC GACGGCACCC AGTGGGTCGT CTTCGAACCC 
AATGACGAAA AGCTCTGGGG ACAGATCCGC ATGAACGTGG GTGCCTTCAT GCAGGGCCTC 
TTCCTGCAAG GCGCATTCCA AGGCACCTCT CCGCAACAGG CCTACTTCGT CAAATGCGAC 
GCCGACAACA ATCCGCAGTC GAGCATTGAT CAGGGCATCG TCAACATTCT CGTCGGATTC 
GCTCCGCTCT ACCCCGCAGA ATTCGTCGTA ATACAGATCC AGCAGATGGC AGGACAGCTT 
CAGGCGTAA

Protein sequence

MPPTFTFPGV YIEEIPSGVH TITGVATSIA AFVGWAAQGP TDEATLVQSW ADFANQFGGL 
DARSNLGYSV NQFFNNGGQQ AYIVRLVSDT TNGNTAAATA SVNIKTITFD ASVSPSKVTV 
TKGAAGLTIS AANQGAWAKN YSIQVQPRID DYNRFTLSVV YTDPVTSAQT IVESYSNLST 
NSADTQGRYV VNILNEQSNY VTAKMAPTPV TLTVTPGVPT TPKASNPGSI ALNASVDGND 
GTPLAPGDTV FEKMLNSGGA GTAGVRLLDT VPIFNILCVP GETVVQNITE LQAYCVDNRA 
FLIVDSKSDD KVKDLALNGP AGITGVNSIN SALYFPWVNQ FDSQTNSTRA FPPCGFVAGL 
YAATDTARGV WKAPAGIDAS LTGDTGLTLN LTNAQNGSLN IQAINCLRNF PVYGDVIWGA 
RTLRGNNQVG SEWKYVPIRR LALFLESSLY DGTQWVVFEP NDEKLWGQIR MNVGAFMQGL 
FLQGAFQGTS PQQAYFVKCD ADNNPQSSID QGIVNILVGF APLYPAEFVV IQIQQMAGQL 
QA