Gene Acid345_2144 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2144
Symbol
ID	4068780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2561769
End bp	2563283
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	59%
IMG OID	637984159
Product	hypothetical protein
Protein accession	YP_591219
Protein GI	94969171
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0621] 2-methylthioadenine synthetase
TIGRFAM ID	[TIGR00089] RNA modification enzyme, MiaB family [TIGR01125] MiaB-like tRNA modifying enzyme YliG, TIGR01125

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGAAA CGAAGTCTTC TGTGAGCACC CTGGAACAGC CGGAAACCAA GCCGAAGAAG 
GTCGGTTTCG TGTCCCTGGG CTGCCCGAAA AATTTGGTCG ATTCCGAAGT AATGATGGGC 
CTGCTGGCCA CCAATGGCGC CGAGATCACC GCGCGCGCCG AAGATGCCGA CATCATCGTC 
GTGAATACCT GCTCGTTTAT CGACACCGCG AAGCAGGAGT CGGTCGACAC CATCCTCGAG 
ATGGCAGGCC ACAAGGCGAC CGGACGCGCG CAGAAGCTGA TCGTTGCTGG ATGCCTGGTC 
GAACGCTATC GCAACGAGAT CCAGAAGAAC ATTCCGGAAG TGGATGCTGT CGTCGGGACC 
GGCGAACTCG AAGCCATCCT TGCCGCGAGC GGGATCGAGC CACGCAAGTC CGAAGCGAAC 
TCTCCTTTCG TCATCCTGAA TTCCACGAGC GCCAGCCAGC AGTTGAAGTC CGGCATCGCC 
GATCGTCCCG AAGGCGCAGC CCGCGAAGAG GCTGGACGCT TCGCACGAAC AGATTGGGAC 
GGCGCTGTCG CCGACCTCCC CAACTATCTC TACGACGAGA ACACGCCGCG CGTGCTTGCT 
ACGCCGAAAT ACATGGCGTA CATCAAGGTC GCCGAGGGCT GCGATCATCC CTGCTCGTTC 
TGCATCATTC CGCAGTTGCG CGGCAAGTTC CGCTCACGCC GCTTTGAATC GGTCGTTGCC 
GAAGCTGAAC GCCTCGCCAA GCAAGGCGTC AAAGAAATCA CCCTCATCGG CCAGGACACC 
ACCTGCTATG GCGAAGATCT CGGCTTGAAA GACGGCCTTG CGCAGTTGCT CGAGCGTCTC 
GCGCAGATCG AAGAACTCCA GTGGGTGCGC TTCCTCTACG CCTACCCGAA CAAGATCACC 
AAGCGCCTGC TGCAGACGAT CGCCGACAAT CCGAAGATCC CGAAGTACAT GGACGTGCCG 
CTGCAACATT CCGCCGCCAA CGTCCTGAAG CGCATGAAGC GCGGCGCGCA CGGCGACATC 
TTCCTCAAGT CCATCGAAGA GATGCGGCGC GTGATTCCCG ATCTCACGCT TCGTACGTCG 
TTCATCGTTG GCTTCCCCGG CGAAACGGAA GAAGACTTCA ACCAGCTTTG CGAGTTCGTC 
AAGGCTGCGC AGATCGATTG GCTCGGTGTC TTCAGCTACT CCGACGAAGA AGGCGCAAAG 
GCCTTCGCAC TCGATGAAAA AGTCCCGCCG CGCGAAATCG AACGCCGCCG TAAGAAGCTG 
ATGTCGTTGC AAAAGCAGAT CAGCAAAAAG AAACGCAAGG CTCTGATCGG CCGCGAATTC 
GATGTCATTC TCGAAGGCCC ATCGGAAGAA ACCGACCTCC TCTGGGAGGG TCGCACTGCG 
ATGCATGCGC CGGAAATTGA CGGCAAGGTT TACATCAACG ATTTCGCAGA ACACGAGAAC 
GTTGAGCCCG GCCAAGTGTT CCGCTGCGAA ATTACCGAAG CCCACGACTA CGACCTGGTG 
GCCCGCTTAC TTTAA

Protein sequence

MPETKSSVST LEQPETKPKK VGFVSLGCPK NLVDSEVMMG LLATNGAEIT ARAEDADIIV 
VNTCSFIDTA KQESVDTILE MAGHKATGRA QKLIVAGCLV ERYRNEIQKN IPEVDAVVGT 
GELEAILAAS GIEPRKSEAN SPFVILNSTS ASQQLKSGIA DRPEGAAREE AGRFARTDWD 
GAVADLPNYL YDENTPRVLA TPKYMAYIKV AEGCDHPCSF CIIPQLRGKF RSRRFESVVA 
EAERLAKQGV KEITLIGQDT TCYGEDLGLK DGLAQLLERL AQIEELQWVR FLYAYPNKIT 
KRLLQTIADN PKIPKYMDVP LQHSAANVLK RMKRGAHGDI FLKSIEEMRR VIPDLTLRTS 
FIVGFPGETE EDFNQLCEFV KAAQIDWLGV FSYSDEEGAK AFALDEKVPP REIERRRKKL 
MSLQKQISKK KRKALIGREF DVILEGPSEE TDLLWEGRTA MHAPEIDGKV YINDFAEHEN 
VEPGQVFRCE ITEAHDYDLV ARLL