Gene Acid345_0009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0009
Symbol
ID	4070019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	11118
End bp	13151
Gene Length	2034 bp
Protein Length	677 aa
Translation table	11
GC content	58%
IMG OID	637982009
Product	endothelin-converting protein 1
Protein accession	YP_589088
Protein GI	94967040
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG3590] Predicted metalloendopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.230717
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCGA TACAAGTTGT ATTGGGCACG GCACTTCTTC TGGCTGGTAT TCCCTGGGTG 
CATGGCGCTC CTGAGGAGAA CGATACCGGC TTCAGCATCG ATGCACTGGA CCGTACTGCG 
GACCCGTGTA CCGACTTCTA CCAATTCGCG TGCGGCAACT GGGTCAAGAA CCATCCGCTG 
CCGGCCGAGC GCACGCGTTT TGCAACCTTC GACCAGCTCG AAGAGCACAA CACCGCAACA 
CTCCGCACAA TTCTCGATAA GGCATCAGAA CAGGCAAAGG CCGGCAGCGC CGACGCCACC 
ACGACGAAGA TTGGCGATTA CTACGCGGCA TGCATGGATG AATCTGCGAT TGACGCAAAG 
GGAACCGCGG CCATCGCTCC TGTGCTGGAG AAAATCCGCG GCATGCAAAG CAGAGCGGAT 
TTGCCGCAGA CGCTGGCAGC ACTGCACCTC ATCAGCGTGG ATGCGTTTTT CGGATTCTTT 
TCCATCACCG ATCCCAAGGA TGCGCGGCAA GTGATCGCCG CCACGGACCA GGGAGGGATT 
GGACTGCCAG AGCGCGATTA CTACCTTACG ACCGATGAGA AATCGGTGAA GCTTCGCGCG 
GAGTATGTGG CACACATCGC GAAGATGCTG GAGCTGGCTG GCACGTCACA AGCAGCCGCG 
GCAAAGTCTG CTGAAAAAGT CATGGCACTG GAGACCCAGC TGGCGAAAAT CTCAATGGAC 
GTCGTGAGCC GCCGCGATCC GGAGAAGCTC TACAACCCGA GTACGCGCGA GAAGCTGGTC 
GCCGGTTCGA AAGACTTCAA TTGGAATCAC TATCTGGCCG CGGTGAATCC GCCGCAGTTC 
GAGAAGATCA ATCACGTCTC GCCGCCGTTC CTGAACGGAT TGGGCGCGGT TCTTCAGAAG 
ACAGACCTCG CGGTAATCAA AGATTATTTA ACTTGGCAAA CGTTGCACGC GGCGTCGCAG 
GAGTTGCCGA CTGGATTCCA GACGGAAGAA TTTCATTTCT ATCGCCAGGT GTTGGGCGGC 
GCGAAGGAGC AGCGTCCGCG CTGGAAGCGC TGCGCGAATT ACACCGACAA TCACCTGGGC 
GAAGCACTCG GCCAGGTGTA CGTGAAGAGT GCATTTGGTG CGCAGGCCAA GGAGCGCATG 
GAAACGATGG TGAAAAATCT CGAGGCCGCG CTGCATGAGG ACATCAGCAA TCTCGACTGG 
ATGTCGCAGG ACACTAAGAA GCAGGCGATG GCGAAACTTG ACGCCATGGT CGACAAGATC 
GGTTATCCGG ACAAGTGGCG CGACTACAGC AACTATCGCG TGGAGCGTGG CGATGCGTTG 
GGAAATCTCT GGCGCGGAAA CGAGTTCGAG ATTCGGCGAC AACTGAACAA GATCGGCAAG 
CCGGTGGACA AGACCGAATG GGGCATGACG CCACCAACGG TGAATGCGGA ATATCATCCG 
GAACGCAATG ACATTACGTT TCCGGCGGGA ATCCTTCAGC CGCCGTTCTT CGACAACCGT 
CTCGATGATG CGATCAACTA TGGCGCGATC GGCGCGGTGA TCGGGCACGA AATGACCCAT 
GGTTTCGATG ACGAGGGCCG TCAGTACGAC CGCGACGGCA ATCTGCACGA TTGGTGGACT 
GCGACCGACG GCAAAGCTTT TACCGACCGT GCGGAATGCA TCGTCAATGA GTATTCGGGT 
TTCGAAGCGA CAGAAGGCGT GAAACTGAAT GGCAAGCTCA CGCTCGGCGA GAACACCGCC 
GACAACGGCG GCGTGAGGGT TGCGCTGATG GCGCTGTTGG CGTCCTACGG GAACAACCCT 
CCGGCCGACG TGGACGGCTT CAGCCCGGAG CAGCGGTTCT TCCTCGGTTA TGGTCACGCT 
TGGTGCGCGA ACCAGACGCC GGAATCGCTG CGGCTGCAAG CGACCACGGA TCCACACTCG 
CCGGGCAAGT GGCGTGTGAA CGGAACGGTT CAGAATATGC CCGAGTTCCG CAAAGCGTTC 
GGCTGCAAAG CCGGCATGGC GATGGCGCCA AGCAATGCCT GTCGCGTTTG GTAG

Protein sequence

MKAIQVVLGT ALLLAGIPWV HGAPEENDTG FSIDALDRTA DPCTDFYQFA CGNWVKNHPL 
PAERTRFATF DQLEEHNTAT LRTILDKASE QAKAGSADAT TTKIGDYYAA CMDESAIDAK 
GTAAIAPVLE KIRGMQSRAD LPQTLAALHL ISVDAFFGFF SITDPKDARQ VIAATDQGGI 
GLPERDYYLT TDEKSVKLRA EYVAHIAKML ELAGTSQAAA AKSAEKVMAL ETQLAKISMD 
VVSRRDPEKL YNPSTREKLV AGSKDFNWNH YLAAVNPPQF EKINHVSPPF LNGLGAVLQK 
TDLAVIKDYL TWQTLHAASQ ELPTGFQTEE FHFYRQVLGG AKEQRPRWKR CANYTDNHLG 
EALGQVYVKS AFGAQAKERM ETMVKNLEAA LHEDISNLDW MSQDTKKQAM AKLDAMVDKI 
GYPDKWRDYS NYRVERGDAL GNLWRGNEFE IRRQLNKIGK PVDKTEWGMT PPTVNAEYHP 
ERNDITFPAG ILQPPFFDNR LDDAINYGAI GAVIGHEMTH GFDDEGRQYD RDGNLHDWWT 
ATDGKAFTDR AECIVNEYSG FEATEGVKLN GKLTLGENTA DNGGVRVALM ALLASYGNNP 
PADVDGFSPE QRFFLGYGHA WCANQTPESL RLQATTDPHS PGKWRVNGTV QNMPEFRKAF 
GCKAGMAMAP SNACRVW