Gene Acid345_4181 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4181
Symbol
ID	4072140
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4947039
End bp	4948607
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	57%
IMG OID	637986212
Product	phospholipase C
Protein accession	YP_593255
Protein GI	94971207
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3511] Phospholipase C
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.424185
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.508071
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATTTTC CCGGTCGGCT CCGTAGCTGT TTCCAGGCCG CTTGTTTCCT CTCGATTCTC 
CTGGGCTCTG CCAATCTCTT CGCGTTGTGC ACGCTCAACA CGCAGAACCA GACCGTCACC 
ATCTGCACAC CAGCTCCGAA CGCCACCGTC TCTTCTCCTG TGAACGTCCA GGCGGGAGTT 
ACCGATAGCA ACGCCGTCAA GGCGCTCCAG ATCTACGTGG ATGGCGTGAA GGTCTATGAA 
ATTGTCGCCA AGACGCTGAA CACCAACGTC ACGATGGCGA ATGGCGCGCA CCGGCTCACC 
GTCCAGGCGC AGGATTCCAC CGGCGCAGTC TTTAAATCCA CCGAGAACAT CAATGTCTCG 
ACCGCGGGAG CCGGCACCAT CAACGACGTG AAGCACATCA TCTTCATGGT CGAAGAGAAC 
CGCTCCTTCG ATAGCTACTT CGGCATGATG GGCGCTTACC GCACGAAGCT AGGTTACGGC 
GGCACCTTTA ATGGCGTGCC GTTGAACGCG TCTCTATCCG ATTACAAAGG CACAGGCAAC 
GTGAGTCCGT TCCATTACCA GACGGTATGC ACGGACAACA TGACTCCAGC CTGGAACGAG 
AGCCACTACT CGTGGCATGC CGGCAAGATG GACTACTTCA TGAAAGTGGA AGGCTCACTG 
CCTTCGTCCA TTGATCCCCA GGGCACGCGC ATCATGGGCT ACTACGACCA GACCGACTTG 
CCGTATTACT ACGAACTCGC AACGCAGTAT GCCACCAGCG ATACCTGGCA TACGCCGATT 
TTGTCTGACA CCATCCCGAA CCGCATGTAC CTCTTCACGG CGACTTCCTT CGGACACATT 
CGCCCGCAAG ATGTGCCGCC CAGCGGCGGA TGGACGCAGC CGACGATCTT CCGGGACCTC 
TCGCAGCACG GAATTACCTG GCGTTATTAC TACCAGGACA ATTCCGTGTA TCTCGCGAGC 
TTCTCCGACT GGAACGCATA TCAGAACAAC GTCTACAACA TCAGCCACTA TTACACCGAC 
ATCCAGAACC CGAGCACGCT ACCAGAGGTG ATCTTCATCG AACGCGGCAG CCAGACGGGC 
GTTGACGAGC ATCCGCTCAA CAACATCCAG AAGGGTGCAG CCGATGTCGC CAAGATCATC 
AACTCGTTCC TGACGAGCCC GAGCTACTCG AGTTCGGTGT TCATCCTGAC CTACGACGAT 
CCCGGCGGTC TCTACGATCA CGTGCCGCCA TTCTCCGAAC CCGCACCCGA CAGTATCCCG 
CCGATGGTGC GGTCTACGGA CATCAAGGGC GACTTCTTGG AGTCCGGTTT CCGCGTACCG 
TTGATCGTGG TTTCCCCATG GACAAAGCCT CATTACGTGT CGCATGTGAA CCGCGACTAC 
ACTGCGATGC TCAAGTTCAT CGAGAAACGT TTCGGACTGC CGGCGCTTAC GAAGCGCGAC 
GCCGCGCAGG ACGATATGAC CGAGATGTTC AACTTTGCAA CGCCACAGAT CCCAACGCCT 
CCCGCTATGC CGACGCAGCC AACCAGCGGT GTCTGCAATA AGAACCTGGA GAAGGCGCCA 
GGATACTAG

Protein sequence

MHFPGRLRSC FQAACFLSIL LGSANLFALC TLNTQNQTVT ICTPAPNATV SSPVNVQAGV 
TDSNAVKALQ IYVDGVKVYE IVAKTLNTNV TMANGAHRLT VQAQDSTGAV FKSTENINVS 
TAGAGTINDV KHIIFMVEEN RSFDSYFGMM GAYRTKLGYG GTFNGVPLNA SLSDYKGTGN 
VSPFHYQTVC TDNMTPAWNE SHYSWHAGKM DYFMKVEGSL PSSIDPQGTR IMGYYDQTDL 
PYYYELATQY ATSDTWHTPI LSDTIPNRMY LFTATSFGHI RPQDVPPSGG WTQPTIFRDL 
SQHGITWRYY YQDNSVYLAS FSDWNAYQNN VYNISHYYTD IQNPSTLPEV IFIERGSQTG 
VDEHPLNNIQ KGAADVAKII NSFLTSPSYS SSVFILTYDD PGGLYDHVPP FSEPAPDSIP 
PMVRSTDIKG DFLESGFRVP LIVVSPWTKP HYVSHVNRDY TAMLKFIEKR FGLPALTKRD 
AAQDDMTEMF NFATPQIPTP PAMPTQPTSG VCNKNLEKAP GY