Gene Acid345_4442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4442
Symbol
ID	4070924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5273801
End bp	5275849
Gene Length	2049 bp
Protein Length	682 aa
Translation table	11
GC content	58%
IMG OID	637986480
Product	glycyl aminopeptidase
Protein accession	YP_593516
Protein GI	94971468
COG category	[R] General function prediction only
COG ID	[COG3975] Predicted protease with the C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGAACC GTGGAAAACT GATTAAACCG TTTCAAGCGT ATACACTGTT GCGCACCATG 
AAGTTTTCGC TCGTTTGCTG CCTTACATTC AGCTCTCTTT TCATCGCCAA CGCGCTAGCG 
CAGGTCAAAA ACCCACCGCA ACCGCAACCT ACTCCACTGC CGCCGGCGAT TGTTGCGCCT 
CTTGATAAAC CATACCCCGC GCCGGTGCAG CTCGAAGTGG ATGTAACGGA CACCTCGCAC 
CACGTAATGC ATGTGCGCGA GGTCGTTCCC GTCGAGAGCG GCGCGAAGGA GTCGGTGCTG 
CTCTATCCGC AATGGATTCC GGGACACCAT TCGCCAACGG GACCCATCTC GCATTTGGCC 
GGAATCGTGA CGAACGTGGA TGGCAAGCGC GTGCAGTGGG TGCGCGATCG CGTGAATGTG 
TTCGCATTCC ATGTGCCGCT CCATCCCGGC GCGAGGACTG TGGAACTTGA GTTCGACTAT 
CTTTCTCCGA ACCGGCAGGC CGAAGGACGT ATCGAGATGT CGGATGCAAT TGCCGACATC 
GAGTGGAGCG AAGTGGTGAT GTATCCCGCG GGCTACTTCA CGCGACAGAT TCCGTTCAAC 
GCTGCGCTGA AGCTTCCCGA AGGTTGGAAG TATGCTACGG CGCTGGAAAC GGACAGCGAG 
AACGGCGCAG CCGTAAAGTT CAAGCAGACG ACGCTGAACA CGCTGGCCGA TTCGCCAGTT 
TATGCGGGGC GCTACTTCAA GCGGATTGAC CTGTCGCCGA CGCAGACCGA CATCGTGCAT 
CTCGATCTCT TCGCAGATGA AGAGAAGGAC CTGGCGATCA CGCCAGAGCA ATTGGAGAAG 
CACAAGAACC TGACGATGGA GGCGGACAAA CTCTACGGTT CGCATCACTA CAACCACTAC 
GACCTGTTGC TGTTATTGAG CGATAAGGTC GGCGGGATTG GGTTGGAGCA TCATCAGTCG 
AGCGAGAACG GGCTGCCGGC GAAGTACTTC ACCGACTGGA GCAACGGCGT GCTCGGTCGC 
GATTTGCTCT CACACGAGTA CACGCATTCG TGGAATGGGA AGTTCCGGCG TCCGGCGGAC 
CTGTGGACAC CGAACTTCAA CGTGCCCATG CGTGACGATC TGTTGTGGGT GTATGAGGGC 
ATGACCCAGT ACTGGGGAAT CGTGCTGGCG GCACGCTCGG GTTTGCGTTC TCCCGAAGAG 
ACACGCGACA TAATTGCGCA CGTAGCGGCG GGCTTCGAAC ATATGCCGGG GCGCAGTTGG 
CGTCCGATGG TGGATACCAC CAACCAGCCG ACGGTCTCGC AACGTCGGCC GGTAAGTTTC 
GTGAGCTGGC AGCTTCCTGA AAATTACTAC GAAGAAGGCG CGCTGATCTG GCTTGACGCG 
GACACGAAGA TCCGCGAACT GACCAACGGA AAGAAGTCGC TCGATGATTT CGCGAAGGCC 
TTCATGGGTG AGTACAACGG AAGCTTCGTC ACCTATACCT ACTCCCTCGA CGACGTGGCC 
AAGACCCTCA ACAGCGTGGC GCCCTACGAC TGGGCGGCGT TTCTGCGCGA ACGCGTTTAT 
GACTTGCATC CCACGGTGCC CGAAGACGGC ATCACCCGCG GCGGCTACAA ACTGGCGTAC 
AGCGACACTG AGCAGGAGTG GATGACGCGC AACAACGCGG CTGAGGGCGA GGCGGACTTT 
TCGACTTCAC TCGGGCTTGA TCTTGCGGTT CCGAAGCCGG GTAGCGGCGA CGACAGCGGC 
CCATCGGGAG CGTTGCTCGA AGTGACGTGG GACAGTCCCG CATTCAAGGC TGGTGTCACT 
CCGGATATGC AGCTCGTATC GGTGAATGGC AAGGAATACT CGCCGGAATT GTTGCGCGAT 
GCGATCCTGG CAGCGGAACA GTCGAAGCAG CCGATGCAGT TGCAATTCAA AAGCAATAAT 
GAGTTCAAGA CGTTCGCGAT TCCGTATTAC GACGGACTTC GGGTGCCTTC ATTGCAACGA 
GTCGAGGGGA CGCCGTCCAG GCTGGACGAC ATTCTTGCGC CGAGTAAGAG CGCGTTGCCG 
GCGATGTAG

Protein sequence

MPNRGKLIKP FQAYTLLRTM KFSLVCCLTF SSLFIANALA QVKNPPQPQP TPLPPAIVAP 
LDKPYPAPVQ LEVDVTDTSH HVMHVREVVP VESGAKESVL LYPQWIPGHH SPTGPISHLA 
GIVTNVDGKR VQWVRDRVNV FAFHVPLHPG ARTVELEFDY LSPNRQAEGR IEMSDAIADI 
EWSEVVMYPA GYFTRQIPFN AALKLPEGWK YATALETDSE NGAAVKFKQT TLNTLADSPV 
YAGRYFKRID LSPTQTDIVH LDLFADEEKD LAITPEQLEK HKNLTMEADK LYGSHHYNHY 
DLLLLLSDKV GGIGLEHHQS SENGLPAKYF TDWSNGVLGR DLLSHEYTHS WNGKFRRPAD 
LWTPNFNVPM RDDLLWVYEG MTQYWGIVLA ARSGLRSPEE TRDIIAHVAA GFEHMPGRSW 
RPMVDTTNQP TVSQRRPVSF VSWQLPENYY EEGALIWLDA DTKIRELTNG KKSLDDFAKA 
FMGEYNGSFV TYTYSLDDVA KTLNSVAPYD WAAFLRERVY DLHPTVPEDG ITRGGYKLAY 
SDTEQEWMTR NNAAEGEADF STSLGLDLAV PKPGSGDDSG PSGALLEVTW DSPAFKAGVT 
PDMQLVSVNG KEYSPELLRD AILAAEQSKQ PMQLQFKSNN EFKTFAIPYY DGLRVPSLQR 
VEGTPSRLDD ILAPSKSALP AM