Gene Acid345_3174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3174
Symbol
ID	4071244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3764498
End bp	3766108
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	62%
IMG OID	637985194
Product	phage portal protein, lambda
Protein accession	YP_592249
Protein GI	94970201
COG category	[R] General function prediction only
COG ID	[COG5511] Bacteriophage capsid protein
TIGRFAM ID	[TIGR01539] phage portal protein, lambda family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.474901
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAATCG AGACGCTTTT CACGACGCCG GAAGCACCGC GGGCCTCGGC CCTGCAAACG 
CTGTTCGATA ACCGCGTGCC TGCGCCTCCT GCTCCTGCGA AGTCGGAGCC GTTGAAGGCG 
AGCACCACCG GGTATCCGTC CTATGCCGGC GCCGGACTCT CGCGCCTCAA TGCCGACTGG 
ATCGGCACGC TACTTTCCAG CGACCAGGAA GTCCGCAACT CCCTCAAGCG CTTGCGTGCC 
CGTTGCCGCC AGCTCCACAA CAACAACGAC TACGCAATGC GCTTCGTGAA CCTCGTCAAG 
CGCAACGCGG TCGGCCCCAA TGGGATCCAG CTCGAGGCGC AATTGCAGGC CGACCAGGAT 
GAACTCGCCG AGCAGGTGAA TGACGAGCTC GAGCGCGGCT GGCGCAAATG GTGTCGCAAA 
GGCAATCCCA CGGCCGACGG CAAGCTCTCC TGGGTCGATG TGCAGAACCT GGTGTGGGAG 
TCGTTGATCG TCGATGGCGA AGTCTTCTTG CGCAAGATCG TCGGCTTCCC CGACAACGAT 
TTTGGTTTCA CGCTTCAGTT CATCGACCCT GACCAGGTGG ACGTGCAGTT CAATCGTCCT 
CGCAAGGTCG ATTCCGCGCG CGGCACCGTG CAGAACGAAG TCCGCATGGG CATCGAGGTA 
AACGAATGGC TGCGCCCGAT CGCCTACTGG GTGCTCGATG GCCACCCGGC GGAAGGGCAC 
GTCAAGCGCA CTGCGATTCC CGCTTCCGAC ATGATCCATA TCCACATGTT CCGCCGCGGC 
AACCAGACGC GCGGTGTGCC CTGGCTCGTG ACCGCCATGA GCCGCATGAA CATGCTGGGC 
GGATATGAAG AGGCTGAGCT CACGTCAGCG CGCGTCGGTG CCTGCCAGGG CGGTTTCTTC 
GTCTCGAAAA CCGGTGAGGA ATATACCGGC CGGAAAAATA AGGACGATGG TTCCGTCGAA 
GTGTCCATGG AGCCGGGTCT TTTCGAACAG TTGCCGGAAG GCGTTGATTT CAAGCCCTTC 
ACTCCGCAGC ATCCCAACGC TGCTTTCCCT GAGTTCGTCA AGGCTATGGT GCGCGGTATG 
GCGGTGGGCC TCGATATCAG CTATCCGTCG CTCGCGGGCG ATCTGCGCGA AGTCAATTTC 
TCTTCCATCC GCCAGGCGGT CCTCGAAGAG CGCGAGATGT ATCGCACCCT GCAGACGTTT 
GCAAAGGACC ACCTCAATCA GCCCGTATAC GAGGCCTGGG TGCCAGCGGC GATCCCGCGC 
AAGCAACTCG CGCTGCCCGC CGCCGGCATA GATGAGTACG TGGATCCCGA GAATCTGCGC 
TGGGTCGGTC GCGGCTGGAC CTGGGTGGAT CCACTGAAGG ACGTGCAGGC CGGCAAGGAA 
GCGCGCGGCA GCGGCCAAAC CACGCTCGCC AAGCTCTGTG CCGCGCAGGG TGAGGATTGG 
CGCGACGTCA TCGACCAGAT CGCGATCGAG GACGACTATG CGGAGAAGAA GGGCGTGATC 
CTGAATTTTG CGGTCACCAA GAGCGCGGAT GGTTTGCCCG CCGTTACACC CGATCCAAGT 
GCACCGCCTG TGCCGGTCAA GGATGGAGAT GAGGAGGGCG AGAACCAGTG A

Protein sequence

MRIETLFTTP EAPRASALQT LFDNRVPAPP APAKSEPLKA STTGYPSYAG AGLSRLNADW 
IGTLLSSDQE VRNSLKRLRA RCRQLHNNND YAMRFVNLVK RNAVGPNGIQ LEAQLQADQD 
ELAEQVNDEL ERGWRKWCRK GNPTADGKLS WVDVQNLVWE SLIVDGEVFL RKIVGFPDND 
FGFTLQFIDP DQVDVQFNRP RKVDSARGTV QNEVRMGIEV NEWLRPIAYW VLDGHPAEGH 
VKRTAIPASD MIHIHMFRRG NQTRGVPWLV TAMSRMNMLG GYEEAELTSA RVGACQGGFF 
VSKTGEEYTG RKNKDDGSVE VSMEPGLFEQ LPEGVDFKPF TPQHPNAAFP EFVKAMVRGM 
AVGLDISYPS LAGDLREVNF SSIRQAVLEE REMYRTLQTF AKDHLNQPVY EAWVPAAIPR 
KQLALPAAGI DEYVDPENLR WVGRGWTWVD PLKDVQAGKE ARGSGQTTLA KLCAAQGEDW 
RDVIDQIAIE DDYAEKKGVI LNFAVTKSAD GLPAVTPDPS APPVPVKDGD EEGENQ