Gene Acid345_3289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3289
Symbol
ID	4072701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3894928
End bp	3896031
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	62%
IMG OID	637985310
Product	peptidase M24
Protein accession	YP_592364
Protein GI	94970316
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.065637
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAAAGC GCCCTCGCTC TTCTGAACCC GACTATGCGC CGCGCGTGCA GAAACTCGAC 
CACGCACTCT GCGGACTCAA ACTCGACTCC ATCCTGATCA CGCATCTGCC GAACATCCGC 
TATCTTTGCG GATTCACCGG CAGCAATGGA CTGCTGCTGT CGATCCGCGG CAAGCGCACG 
TTCTTCACCG ACGGGCGCTA CACCGAGCAG GCGGAGCAGG AGGTGACGGG CACGAGGGTC 
GTGGTGCCGA AAGGGAGCCT GATCGCCGAG GCAGCAAAGC TAATCGCCGC GAGCAAGATC 
ACGCGGCTAG GTTTCGAAGC CGATCGCACC ACCGTGACCA GAGAGCAGGC CATCAAGAAG 
GCGCTCCCGA AATCGGTAAA GCTGACGCCG ACTGCGTCGG TCGTGGACCG CATTCGGATG 
GTCAAAGACG AGCACGAGCT GGCGCTGATC AAGGAAGCCG TGATCATGGG CGCCGACCTG 
CTGACTCCGG CGATCGAGAC GATTCGCCCG GGCGTGAAGG AGTCCGAAGT CACGGCGGAG 
ATTGAGTACG CCGCCCGGCG CTGGGGCGCC GAGGCCATGT CATTCGAGAC CATTGTGGCG 
GCCGGCGTAC GCAGCGCTTT GCCCCACGGA CGGGCGTCTA ACGCGTTGAT TCCAAAGCGC 
GGATTCGTGA TCCTAGACCT GGGTGTTATA CTCCACGGTT ACTGTTCGGA CATGACCCGC 
ACCGTACACG TCGGGTCAGT TCCGCGCCGT TCCCGCGAAA TTTTCCAGGC AGTCCTGGAC 
GCTCAACTAG CGGCAACGGC AGCCGTTAAG CCCGGAGCGA CCGCTGGCGA TGTGGATTTT 
GCTGCGCGGT CGGTATTGAA GCGAGCGAAG TTAGACCGCT ACTTCATTCA CTCGACGGGC 
CACGGGGTGG GGTTAGAGAT CCACGAACAG CCGCGCATTG CGCGGGATCA AAAAGAAGTT 
CTCGAGCCGG GCATGGTGAT TACGATCGAG CCCGGCGTTT ATCTGCCCGG TGAGGGCGGT 
GTGCGGATTG AAGACATGGT TGTGGTGACC GAGCGAGGGC ACCAGGTCCT GACGCCCGCC 
ACCAAGGAAC TGCTCGAGTT ATAG

Protein sequence

MRKRPRSSEP DYAPRVQKLD HALCGLKLDS ILITHLPNIR YLCGFTGSNG LLLSIRGKRT 
FFTDGRYTEQ AEQEVTGTRV VVPKGSLIAE AAKLIAASKI TRLGFEADRT TVTREQAIKK 
ALPKSVKLTP TASVVDRIRM VKDEHELALI KEAVIMGADL LTPAIETIRP GVKESEVTAE 
IEYAARRWGA EAMSFETIVA AGVRSALPHG RASNALIPKR GFVILDLGVI LHGYCSDMTR 
TVHVGSVPRR SREIFQAVLD AQLAATAAVK PGATAGDVDF AARSVLKRAK LDRYFIHSTG 
HGVGLEIHEQ PRIARDQKEV LEPGMVITIE PGVYLPGEGG VRIEDMVVVT ERGHQVLTPA 
TKELLEL