Gene Acid345_2140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2140
Symbol
ID	4072382
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2558445
End bp	2559689
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	62%
IMG OID	637984155
Product	competence/damage-inducible protein cinA
Protein accession	YP_591215
Protein GI	94969167
COG category	[R] General function prediction only
COG ID	[COG1058] Predicted nucleotide-utilizing enzyme related to molybdopterin-biosynthesis enzyme MoeA [COG1546] Uncharacterized protein (competence- and mitomycin-induced)
TIGRFAM ID	[TIGR00199] competence/damage-inducible protein CinA C-terminal domain [TIGR00200] competence/damage-inducible protein CinA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCGCCG AGATCGTCGC TATTGGGTCT GAGCTCCTAA CCCCCTTTCG TCAGGACACC 
AACTCGCTTT ACCTCACCCA ACGCTTGAAC GAGATGGGGG TCGAGGTCGC GTTCAAAAAC 
ATTGTCGGCG ACAGTCGCGC GAACCTGGCG AGCGTGGCAC GTACCGCGAT CGCCCGCTCG 
CACATCGTCC TCTTCATGGG CGGCCTTGGC CCAACCGAAG ACGACCTCAC CCGTGAAGCC 
GTCGCCGATG CGCTCGGTCT TCGCCTCAAG CGCAATCCCG ATCTCGTTGC CGAACTCTAC 
AAGCGCTTCG CATCGCGCCG CGTGACCATG CCCGACAACA ACATGCGCCA GGCCGACGTG 
ATTGCCGGAG CCGAAATAAT CCAGAACGAC AACGGTTCGG CGCCGGGACA GTTCATCGAA 
GGCGAACAAG ACGGCCAGCC GCGATACATC TTCCTGCTGC CCGGGCCTCC ACACGAACTC 
AAGGCGATGT GGAATGAGAA GTGCCACCAT ACGCTGCGCG ACCGTCTACC TCGCGCCTAC 
ATCGCCACGC GCGAGCTGCG GATTTCCAGC CTTGGGGAAT CGACCGTTGA CGCCCGCGTC 
GCCCCGATTT ACACCAAGTA CAAAAACGTC GACACCACGA TCCTCGCCAA ACCCGGTGAG 
GTCAGCTTGC ACCTGAAGAG CCGCGCCGCC ACGATGGAAC AGGCGCAGGC CGCGGTCGAT 
CAACTCGCGG CCGAACTCGA AGACGAACTC GATGACGCTG TGTTCTCTAC CAACGGCGAA 
TCGCTCGAAC AGATCGTCGG CTACTACCTG CAAATGCGCA GCGGAACGAT CTCCGTTGCC 
GAGAGCTGCA CCGGCGGATT GCTCGCGGAA CGGCTGACGA ACGTCAGCGG CAGCTCGCGC 
TATTTTATCG GCGGCGTGGT GGTCTATTCC AACCAGATGA AAACCCTGCT CGCCGACGTG 
CCCCCGCTGA TGATCGAAGA GCACGGCGCG GTGAGCCGGC AAGTTGCCGT TGCGCTCGCC 
GAAAACTTCC GCGAGATCAC CAACTCGACC ATCGGCGTCG GGATCACTGG TATCGCCGGA 
CCGACCGGTG GCACCGAAGA CAAGCCAGTT GGCCTCGTGT ACATCGCCGT CGCCGACGAG 
CTCGGAACCG ATGTCGTAGA ACGACGTTTC CCCGGCGATC GAGAACGCAT CCGCTGGTGG 
TCGAGCCAAG TGGCGCTCGA CATGGTGCGC AAAAAACTGA TCTGA

Protein sequence

MIAEIVAIGS ELLTPFRQDT NSLYLTQRLN EMGVEVAFKN IVGDSRANLA SVARTAIARS 
HIVLFMGGLG PTEDDLTREA VADALGLRLK RNPDLVAELY KRFASRRVTM PDNNMRQADV 
IAGAEIIQND NGSAPGQFIE GEQDGQPRYI FLLPGPPHEL KAMWNEKCHH TLRDRLPRAY 
IATRELRISS LGESTVDARV APIYTKYKNV DTTILAKPGE VSLHLKSRAA TMEQAQAAVD 
QLAAELEDEL DDAVFSTNGE SLEQIVGYYL QMRSGTISVA ESCTGGLLAE RLTNVSGSSR 
YFIGGVVVYS NQMKTLLADV PPLMIEEHGA VSRQVAVALA ENFREITNST IGVGITGIAG 
PTGGTEDKPV GLVYIAVADE LGTDVVERRF PGDRERIRWW SSQVALDMVR KKLI