Gene Acid345_2733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2733
Symbol
ID	4069424
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3232610
End bp	3234277
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	61%
IMG OID	637984750
Product	hypothetical protein
Protein accession	YP_591808
Protein GI	94969760
COG category	[S] Function unknown
COG ID	[COG5617] Predicted integral membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.595283
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTTTCA AAAACGGAAT CCGGGCCGGA CTTTGGTGGA CTCCCCTCGT TGCTCTCCTT 
GCCGTCTCGC CGTTTTTCTG GCGCGGCACC AGCAACGGTC ACGACCTCCC CTTCCACGTC 
AACTCATGGA TCGAGGTCGG TCGCCAGTGG AAATCGGGAA TCCTCTACCC ACATTGGGCG 
GCGTTCGCCA ATTTCGGGAG CGGCGAACCA CGCTTCGTCT TCTATCCGCC CATCTCGTGG 
ACCCTTGGCG CACTCCTCGG CCTCGCACTG CCCTGGCAAG CAGTCCCCGG CACCCTCGCT 
GCACTCGTCT GCATTGCAGC CGGCATCAGC ATGTATCTCT TCGCCAGCGA GTGGCTCGAT 
GCACAAACCG CCGTCCTTGC CGCCGTCCTC TATGCCGTGA ACCCCTATCA GCTCATCGTG 
ATCTACGAGC GCGGCGCCTT CGCCGAGATG ATCGCCTCTA TCTGGATCCC CGGCATCCTG 
CTCTTCGCGA TGCGTGAACG CAGCAGCTTC GCCCGCAACA CCTTGCTGCT CGCGGTCCAC 
ATGGCGCTCG TGTGGCTCAC CAACATTCCC GCCGCCGTGA TCGCCACCTA CTTGCTCGCA 
TTCGTCGCAA TTATTCGCGC CGTCCAAACC CGAAAGCTTG AGCCCGTTCT TCGCGCCGCT 
GCGGCATTCG TCCTCGGGCT CGGCCTCGCA GCGTTCTATC TCGTTCCCGC CATTTACGAG 
CAGCAATGGG TGCAGGTCAG CGCGGCTGTC GCAGCCGGCG CCTCCCCTCG CGACAATCTC 
CTTTTCGCCC GCACCGGCGA CCTCGAACGC GACGCCGTTC TCTTCCGCAC TTCCATCTTC 
GCGCTCATCG AATTCTGTGC TGCGGTCGTT TGCGTCGGAC TCGCAAAGCC GCTCCGTCGC 
AGCCTGCTGC AGCTCTATAA CGTGCTGCTC AGCGCGATCG TCCTCGTTGT CATACTCCTC 
TCGCCGCTCA GCCTGCCGTT GTGGAAATAT CTGCCGAAGT TGCAGTTCGT CCAGTTCCCC 
TGGCGCTGGC TCCTGGTTCT CAATGTCGCG ATGATGTTTT TCGCCGCCGT CGCCTTCGCG 
CGAACGCGGA TCTCCCGTCT CGCTGTCTTC GCGATCATCC CGCTCGTGAT CGCCATCTGT 
TATTGGAAAT TCCAGCAGCC TATCTACCCT GAAGATCGTC CCGTCGCGCT GGCGCAGGCT 
GTTGGCGATG GCGCCGGCTA CGAGGGCACC GACGAATACA CGCCCACGCA GGCCGACAAC 
TCCAATTTCG CACCTTACAT GGCGCGCATC GCCGTCCAGA TCACCACCGA AAACGATGAG 
CAGCGCAAAG TCGCCCCCAG CACACTCGCG CACAGCAATG CCGATGTTTG GGACACCCTG 
CACAAACACT TCACCATGGA TTCACAGGTC CCCACGCGTT CCACGCTCCG ACTGCTCGAC 
TACCCAGCGT GGCAGGTCAC GGTGGATGGC ACACCCTTTC AGCAGACCTA CGATCAAGCA 
GACGGACGCA TGATCGTGGC TCTACCCGCC GGACATCATG AAGTTGATAT CTCTTACCGG 
AAGACTCCAG ACCGTCGATG GGGCCAATGG ATTTCTTTGT TCGCGCTCAT CCTAACCATC 
GGCATATATG CCATGGCCCG GAGCGACCGT CGCTCTTTGC CAACTTAG

Protein sequence

MRFKNGIRAG LWWTPLVALL AVSPFFWRGT SNGHDLPFHV NSWIEVGRQW KSGILYPHWA 
AFANFGSGEP RFVFYPPISW TLGALLGLAL PWQAVPGTLA ALVCIAAGIS MYLFASEWLD 
AQTAVLAAVL YAVNPYQLIV IYERGAFAEM IASIWIPGIL LFAMRERSSF ARNTLLLAVH 
MALVWLTNIP AAVIATYLLA FVAIIRAVQT RKLEPVLRAA AAFVLGLGLA AFYLVPAIYE 
QQWVQVSAAV AAGASPRDNL LFARTGDLER DAVLFRTSIF ALIEFCAAVV CVGLAKPLRR 
SLLQLYNVLL SAIVLVVILL SPLSLPLWKY LPKLQFVQFP WRWLLVLNVA MMFFAAVAFA 
RTRISRLAVF AIIPLVIAIC YWKFQQPIYP EDRPVALAQA VGDGAGYEGT DEYTPTQADN 
SNFAPYMARI AVQITTENDE QRKVAPSTLA HSNADVWDTL HKHFTMDSQV PTRSTLRLLD 
YPAWQVTVDG TPFQQTYDQA DGRMIVALPA GHHEVDISYR KTPDRRWGQW ISLFALILTI 
GIYAMARSDR RSLPT