Gene Acid345_3176 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3176
Symbol
ID	4071246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3766976
End bp	3769057
Gene Length	2082 bp
Protein Length	693 aa
Translation table	11
GC content	60%
IMG OID	637985196
Product	phage terminase GpA
Protein accession	YP_592251
Protein GI	94970203
COG category	[R] General function prediction only
COG ID	[COG5525] Bacteriophage tail assembly protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.693881
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCTG CTCCAATCAT CGCCACACAG GATCCCGTCC TCGCCGTCTT CCAGGAGGCC 
GCACAGGTCT TCCGGCCTGC ACCGGCGCTC ACCATCACCG AGTGGGCAGA GCGTCATCGC 
ATTCTCAGTA CCGAGAGTTC GGTCAGTGCC GGCCTCTATC GTTGCGAGGT CACGCCCTAT 
GCGCGCGAGA TGCAGGATGC CATTAAGGAT CCCGACGTCG AAGAGGTTGT CTTCTGGACC 
GCCGCGCAGA TGGGCAAGTC CACTTCGCAG GAGAACATCG CGGCCTATTT CATCTGCGAA 
GATCCATGCC CAATCATCTG GATGTGGCCG ACCAAAGAAG TCGCGCGTGA TTGGTCGGTC 
GATACACTCG ATCCACTACT TCGCGACTCG CCCGAGTTGT CGCGCCGTTT CACTGAAGGC 
TCGCGCAAAT CATCGAACCG CGGGCTCTTT AAAAAGTTTC CCGGCGGGTA TCTCTCCGCG 
ATCGGTGCCA ACTCGGCGTC AGGCCTGCGG CGCCGTCGAG CCCGTCTGCT CATCTGCGAC 
GAAATCGACG GCAACCCGCC CAGCGCCGGC GACGAAGGCG ATCCCATCGA GATTGTCATC 
TCCCGTGCTG AAACTTTCTG GAACCGCAAG CGCGTCCTGG CTTCTACCTG CACCAATAAG 
GGTGAGTCGC GGATCGAAGG CCGCTATGAG ATCAGCTCGA AAGGGAAGTA CTGGGTGCCA 
TGCACGAGCT GCGGTGAACT CATGCTCCTT TCCTTCCGGG GCCTCAAGTG GCCGAAGGGA 
GAAGAGCCCA CCATCGAGAA TACGTATCTT CCGTGCGAAC ACTGCGGCGT TGTGCTCACC 
GAGGCCGATA AACCTGCCAT GCTCGCCGCC GGCCGCTGGA TCCACGAGCA TCCCGAGCGC 
AAAATCCGCG GCTATTGGAT CAACAAGATG TATTCGCCCT TCGTGGCCTG GTGGGAACTC 
GCAGCCAAGT TCAAGCGTCT GAACGCGCGT ACCACGGAAG ACCGCGAGGC GCTCAAGCCT 
TTCGTCAATC TCGATCTCGC TGAGACCTGG GAGGTAAAGG ACGAAAAGCC CGATCGTAAT 
CGCTTGGTCG ATCGCCGTGA GACCTACGAA ATACTCCGCG AGCAGCGCGA AGAAGGCGCG 
CCCGCCAGCC AATCGAAGCT TGTCCAGGTC TCGCTCCTGC CGGATAGTGT CACCGTCCTT 
ACCTGCTCCG TGGACGTGCA GGTCGATCGC CTTGAGTTCG AAATCGTCGG ATGGGGTCAC 
AAGCGCGAAA GTTGGTCGAT CTATGTTGGC AACGTTCCCG GAGATCCCAA GAACGAAGCC 
GTATGGCTGC GCCTCGATCA AATTCTCCAG ATGGAGCTGC AGCACCATCG CGGGTCCATG 
CTGCCGATCG CGGCCACCTT CGTCGATTCC GGCTTCGACG CCCCCGAGGT CTACAACTTC 
ACCAAGCCGC GCGCCTATCG CTGGGTGTTT GCCTCGAAGG GCTCGTCGGA GTTCAATCAC 
GTCCCGCTGG CGAAGAAGAA GCACATCGAT CGCAGCAACG TGTGGCTCTA CCAGGTCGGC 
GTCGGTCAAA TCAAAAAGAC GATCTATGCC AACCTCATGG TCACCGCGCC TGGGCCGGCG 
TACATGCACT TCACCACCGC GCACAACACG CCCGAGTACT TCGATCAGCT CACCGCCGAA 
ACTCTTGAGA GCTACTACGA GCACGGTTTT CCACGGAAGC GCTGGAAGAA GCAGCCCGGC 
GCTCGCAACG AGGCTCTCGA TCTTCGGGTG TACAACTACG CCGCGTTCCT GTCGCTGAGC 
GAGCAGCCCG ATAAGCTCCT CGATCGCCTG CGCGAGCAGT TGCTGCTCGA CGCGAAGAAA 
CTGGAAGATG CGGGCGCGAA AGAGAACCAG TTGCCGCTCA TCTCCACCGA GCTCCCGCCT 
TCCACGCCTC CCGAGCCCGT CGATCGCGCG GAAGCGACTG CAGCGACAGC CGAAAAGCTC 
GCCGAGACGC TCACGGCCGC CCTCGCGCCT CCGCCTGTTG TAGCGCCTCC TTCTGAATCG 
TTCACGCCAA GGGTCAAGGT CAAGCGCTCT AGTTGGCTCT AG

Protein sequence

MTSAPIIATQ DPVLAVFQEA AQVFRPAPAL TITEWAERHR ILSTESSVSA GLYRCEVTPY 
AREMQDAIKD PDVEEVVFWT AAQMGKSTSQ ENIAAYFICE DPCPIIWMWP TKEVARDWSV 
DTLDPLLRDS PELSRRFTEG SRKSSNRGLF KKFPGGYLSA IGANSASGLR RRRARLLICD 
EIDGNPPSAG DEGDPIEIVI SRAETFWNRK RVLASTCTNK GESRIEGRYE ISSKGKYWVP 
CTSCGELMLL SFRGLKWPKG EEPTIENTYL PCEHCGVVLT EADKPAMLAA GRWIHEHPER 
KIRGYWINKM YSPFVAWWEL AAKFKRLNAR TTEDREALKP FVNLDLAETW EVKDEKPDRN 
RLVDRRETYE ILREQREEGA PASQSKLVQV SLLPDSVTVL TCSVDVQVDR LEFEIVGWGH 
KRESWSIYVG NVPGDPKNEA VWLRLDQILQ MELQHHRGSM LPIAATFVDS GFDAPEVYNF 
TKPRAYRWVF ASKGSSEFNH VPLAKKKHID RSNVWLYQVG VGQIKKTIYA NLMVTAPGPA 
YMHFTTAHNT PEYFDQLTAE TLESYYEHGF PRKRWKKQPG ARNEALDLRV YNYAAFLSLS 
EQPDKLLDRL REQLLLDAKK LEDAGAKENQ LPLISTELPP STPPEPVDRA EATAATAEKL 
AETLTAALAP PPVVAPPSES FTPRVKVKRS SWL