Gene Acid345_2016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2016
Symbol
ID	4070345
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2414440
End bp	2415954
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	57%
IMG OID	637984030
Product	rhomboid-like protein
Protein accession	YP_591091
Protein GI	94969043
COG category	[R] General function prediction only
COG ID	[COG0705] Uncharacterized membrane protein (homolog of Drosophila rhomboid)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGTTGC CCATTGGGCG TGAGAAAAAG ATAGTCAAAC GATTGCCGAT CGTGACTGTC 
ATCCTGATTC TCACTAACAT TCTCGCTTTC TGCCTGACGA TCCGCGACAT CGATGACGAT 
ACAGGCAACC GGAACCTCAA CACGGTCCGC AACCACTTGC TGGTCATGAA GGCGCGGTTC 
CCGGACGTCG TGTTGGATAC CGAAGCGCAG CAGATGGTGG ACGACTTCCG GAAGACTCGA 
CCCGAAGCCT GGCAGATGGT TGCGGACCCG AACCGCGAGC CGATGGACAC ATGGGAAGCC 
GTACTAGTCG ATGAAGAGAA CCCGAAAATC GAGAAGCTCC AGGAGCAGGT AAACCTGCTC 
TGCATCGAGT TTCGCGACCT TCAAAACCGA GACAACTCCG TCCTCTGGAT GTACGCATTC 
CACTCCTATC ATCCTAAGTA CCGGAGTTAC ATCAGCCATC AGTTCCTGCA CGGAGGGTTC 
TTTCACCTCC TCGGCAACAT GTGGATGTTG TGGCTGTGCG GCGTTGTCCT GGAAGAAGTC 
TGGGGACCCT ACGTGGTGCT GGGCTTCTAC CTCTGTGCCG GAGTATTCGC AGCCGCGGCG 
CATGGCGCCA TGAACCCGAA TTCGCTCATA CCGATGCTTG GAGCCTCGGG ATCGGTGGCC 
GGCCTCATGG GCGGCATGCT GGTGCGCTAC CCGAAGCTCA AAGTAAAGAT GTTGTTCTGG 
CTGTTCTTCT ACTGGCGAAC ATTTTTCGCG CCGGTTTACA TCCTTGCGCC GCTGTGGTTT 
GTTGCCGAAC TGTTCTGGGG CGGGCTCGGT GAGCGCGGCA TTGCCCACTG GGCACACGTT 
GGGGGCTTCG CATTTGGAGC GGTCGTGGCG CTGGCCTTCG ATTTCGGCCG CGTCGAGAAG 
ATTACGAACC CGGAAGAACC TGTGCCGGTA GTCTGGAAGC CCGACACCGA GTTCCTGCAT 
GCGGCGCAGT TGCTGGAAAA ACGCGAGACG AATACTGCGC TCGCCATTCT CCGAAACTAC 
GTGAAGAAGA ATTCGAATGT GATCGACGCA TGGGAATTGT TGCAGCAGGC GCAGATTCAG 
AAGAACGATG CAAACGAGCA GCGTCAAGAA ACACTTCCGG TCCTGATTCG TCTTTATCTC 
GGGGTTGGAA ACGACGAACG GGCGCTTTTG CACCTGCGCG AGTTCCGCAG GCTCGGAGGA 
ACGATCCTTC CAGCTTCAAC GTGGCTTGAA CTCGCACGAA GCTACGAACG GGTGGAACAG 
TGGGAAATCG CCGCCCGCGA ATTCGAGAAC CTTGGCATTT CGTATTACGC CACGGACCGA 
ACATCGCTGA CGGCGCTGCT GAGCGCAGCC AGAATCTATC TCACGAAGCT CGATCGCCCG 
GCCGATGCAA ACCGCCTTTA TCAGGCGGCC GGCAACTCGC CGATACCACA CTTGGAAATG 
GATGCGGTGA TCAAGCATGG GATCAGCCAG TCCGCCGCTG CGAATACCGC AAAGAGCAAT 
GGTGTAGCGT TCTAG

Protein sequence

MLLPIGREKK IVKRLPIVTV ILILTNILAF CLTIRDIDDD TGNRNLNTVR NHLLVMKARF 
PDVVLDTEAQ QMVDDFRKTR PEAWQMVADP NREPMDTWEA VLVDEENPKI EKLQEQVNLL 
CIEFRDLQNR DNSVLWMYAF HSYHPKYRSY ISHQFLHGGF FHLLGNMWML WLCGVVLEEV 
WGPYVVLGFY LCAGVFAAAA HGAMNPNSLI PMLGASGSVA GLMGGMLVRY PKLKVKMLFW 
LFFYWRTFFA PVYILAPLWF VAELFWGGLG ERGIAHWAHV GGFAFGAVVA LAFDFGRVEK 
ITNPEEPVPV VWKPDTEFLH AAQLLEKRET NTALAILRNY VKKNSNVIDA WELLQQAQIQ 
KNDANEQRQE TLPVLIRLYL GVGNDERALL HLREFRRLGG TILPASTWLE LARSYERVEQ 
WEIAAREFEN LGISYYATDR TSLTALLSAA RIYLTKLDRP ADANRLYQAA GNSPIPHLEM 
DAVIKHGISQ SAAANTAKSN GVAF