Gene Acid345_4436 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4436
Symbol
ID	4070918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	5266920
End bp	5267888
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	59%
IMG OID	637986474
Product	hypothetical protein
Protein accession	YP_593510
Protein GI	94971462
COG category	[S] Function unknown
COG ID	[COG3391] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02276] 40-residue YVTN family beta-propeller repeat

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0659418
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAAAC GCTATGCGCT GCTGCTTCTC CTCCTAGTTG CTCCGATCTG TGTTTTCGCA 
CAAGCAGCAC CCTCATACAC GGTTGCCGAA ATCGCCCTCC TGAAGTACGC GCCCACTACG 
GTGCCCACGT TTAGCTACGG CGCCGCCCCC GCCGGGATCG CATTTGATGG ACAGCACATC 
TGGATTGCGA GCTCCGGCGA TGGCAGAGTC ATCCCCCTAA ACACCTTCGA CGGTTCGGGA 
GCCGCTCTGG GGCCCGGTTC GGTTGGCACA TCGCCATGGG CCCTCGCTTA CGATGGCGAA 
TATATGTGGG TCACGAGTTA CCCGGATAGC GCGGTCTACA AGTTCCGCCC ATCCGGCGGA 
TCGCCCATTT CTTACCCGAT CAAGTACGGT TCGCGAGGTA TCGCGTTCGA CGGCACATAC 
ATGTGGATTG CCAACCAGCC GCATAACTGT GTCACCCGCA TCCGCGCCAT CGACGGCGCC 
TTTGCTACCT GTTTCCCCAT CGGCAAGGAA CCGATGAACG TAGCTTTCGA TGGTACCGAT 
ATCTGGGTCA CCAACTTCGG CGACAACACC GTCTCGAAGC TCAATACGCA GACCGGAGCG 
GTGATTGGGA CGTATTCGTC CGGCGGGTCA CAGCCGTGGG GAATCGCGTT TGTGCCGGAG 
CCGATTTACG GGGGCGCCCG TTTGATGGTC GTGACGAACG CAGGAAGCAA CACGGCGGTC 
CTTATGCTCC TTGACGGAAG CGTCAATGCC ACAATTCCGG TGGGACTTGT GCCGCGAGGC 
GTCATCTACG ACGGGCATGA CGTATGGGTG GCAAACTCTT CCAGTTCGTC GCTGTCGAAA 
ATTGATTGGA TTGACGGTGG GACGACGGTC ACCAACTACC CCGTCGGCAA ACAGCCCTAC 
GCCCTCGCGT TCGACGGCGC CAATGTCTGG GCCGTGAACT ACGGGTCGAA TTCGGTTTCG 
AAACGGTGA

Protein sequence

MLKRYALLLL LLVAPICVFA QAAPSYTVAE IALLKYAPTT VPTFSYGAAP AGIAFDGQHI 
WIASSGDGRV IPLNTFDGSG AALGPGSVGT SPWALAYDGE YMWVTSYPDS AVYKFRPSGG 
SPISYPIKYG SRGIAFDGTY MWIANQPHNC VTRIRAIDGA FATCFPIGKE PMNVAFDGTD 
IWVTNFGDNT VSKLNTQTGA VIGTYSSGGS QPWGIAFVPE PIYGGARLMV VTNAGSNTAV 
LMLLDGSVNA TIPVGLVPRG VIYDGHDVWV ANSSSSSLSK IDWIDGGTTV TNYPVGKQPY 
ALAFDGANVW AVNYGSNSVS KR