Gene Acid345_4249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4249
Symbol
ID	4073176
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5042322
End bp	5043380
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	55%
IMG OID	637986281
Product	peptidase M12A, astacin
Protein accession	YP_593323
Protein GI	94971275
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.150684
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.841288
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTACCC GATCACTCTG CGGCTTGATG TTAGTAGTCG TGGTTGCATC CACGTTGTTT 
GCCCAAGAAA TCGCCGGCCG GCTTCCCACT GTCGAGTCAC TGCCGGACCG CGTGCAGGCA 
CGCATTGAGG TCAGAACGAG AGCGGCTGGA AATGCGCACA ACGCCGGTCG CTTTGGCATG 
CAGTACTTCA TGTTCATTAC AAAACGTTGG CCGAATGCAG CGAGCACGCC GATTACCGTG 
GCGTTCCTTG GCGGCGATCG TCAACTGCGG CAGCGCATCC AAGACACCGT TACGGAATGG 
AGTCAGGCTG GCACGCTGAG GTTTGATTTC ATCGATCCGG CGTCCCACAC CTTCCGCGAG 
TGGTCGCGCT CTGACACCAG TTTTAAAGCA AACATTCGGG TAGCATTCGA CGGCTCTGAA 
GAAGCGGGCT ACTGGTCTAT GATCGGCGTC GACAGCTCCG ACCCAACGAT CATCAAGCCG 
GGTGAGGCAT CACTGATGTT GCAAGGATTT ACGACACTGC TGCCGCAGGA CTGGCAGGCG 
ACGGTCCGTC ACGAATTTGG CCACGCGCTC GGGCTTCTCC ATGAACACCA AATCCCAGTG 
GGCGGGTGCG ATCAAGATTT TCGATGGGAG GACGATACCG GCTACGTGCC CACTCAGGAC 
TCCTACGGAC AGTACATTAC CGATGCCCAA GGTCGGCGAC CCGGCATCTA CACCTTACTC 
GCAGGCGCAC CGAACTTTTG GCAAAAGGAC AAGGTCAATA GCAACATGAG GCAGCTCGCA 
ACTGACTCCC ACAATAAGGA CTTCGGGGCT TTCGATGCAA AGTCAATCAT GAAGTATTAC 
TTCGACCCGT CGTTCTTTCG CGACGGAACA GCTGCCCATT GTTACAGCGA CGAAAATTTG 
ACGATCTCAG ACGAGGACAA GCAGGGCATA GCGAAATGGT ATCCACCATT CGGCTCTCAG 
GAACTGAGCA ATCTACTCAA ATTGCAACAG GACACTATGC GACAACTTGC GCCTGTGCAC 
AACATGCAGC AGGTTCAGAC GCTTCAGTCA ATCAAGTAG

Protein sequence

MFTRSLCGLM LVVVVASTLF AQEIAGRLPT VESLPDRVQA RIEVRTRAAG NAHNAGRFGM 
QYFMFITKRW PNAASTPITV AFLGGDRQLR QRIQDTVTEW SQAGTLRFDF IDPASHTFRE 
WSRSDTSFKA NIRVAFDGSE EAGYWSMIGV DSSDPTIIKP GEASLMLQGF TTLLPQDWQA 
TVRHEFGHAL GLLHEHQIPV GGCDQDFRWE DDTGYVPTQD SYGQYITDAQ GRRPGIYTLL 
AGAPNFWQKD KVNSNMRQLA TDSHNKDFGA FDAKSIMKYY FDPSFFRDGT AAHCYSDENL 
TISDEDKQGI AKWYPPFGSQ ELSNLLKLQQ DTMRQLAPVH NMQQVQTLQS IK