Gene Acid345_4221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4221
Symbol
ID	4073147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4999753
End bp	5000988
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	60%
IMG OID	637986252
Product	alanine racemase
Protein accession	YP_593295
Protein GI	94971247
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0787] Alanine racemase
TIGRFAM ID	[TIGR00492] alanine racemase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.53018
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.063385
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCGGC CCGGTTTTTT CTGCCCCGAA TCTATAATCA AATCCGTGGC TGTCTCTTCT 
GCCGATCTCG CAGTGATCAA CACCCGCCCG ACGTGGGCGG AGGTGGATCT CTCCGCGCTG 
CGACATAACT ACCGGACCCT GTCGTCGCAT GTGGCGCCGA AGGCGCAGAT TTGCGCGGTG 
GTGAAGTGCG ACGCCTATGG TCACGGTGCA CTCGAGTGCG CGCAGGCCCT GGAGGCCGAG 
GGCGCGAAAT GGTTCGGCGT AACCAATCCT TCGGAGGCGC TGGTGTTGCG GCGGGGCGGC 
ATCAAGGGCC GGATTCTTCT GCTGAGCGGA TTCTGGCAGG GCGAAGAAGA GAGCGTGCTG 
GAGCACGACT TCACGCCTGC GGTATGGACC GAAGGTCACG TGGCGTGGCT GGATGCGGCG 
GCCAAACGTT TTGGGCGGAC CAAGGTTCCA GTCCATCTGA AGATCGACAC TGGGATGTCG 
CGACTCGGGG TGCGCTGGAA TGAGTTGCCG ACACTGCTGC CGAAGCTGTT TCGTGCACGG 
CGACTCAGTA TCGAGGGAGT TTGGAGTCAT CTCGCGTCGT CGGAAGTAGT GGATGCCTTT 
GACGCGCAGG CGCAGATTGC GAATTTTGAG CAGGCGTTGA CCTATCTCGC AGATGAAGGC 
GTGAAGTGGA AGTACCGACA TCTTGCCAAT AGCGCTGCGG TCGCAGTGCG GCCTTCCACG 
TGGTACGACA TGGTGCGCCC TGGACTACTT CTCTACGGGC ATTGCCTGCC TCTGACGCAT 
ACGAACCACG TGTCGCCCGA TGTACATTTG CAACTCGCGT TGAAGCCGGT GTTGTCGTGG 
AAGACGAGGG TTGTCGATAT CCGGCGCGTT CCGGCGGGAC AGGGAGTGGG CTATGGGTCC 
ACGTTTACGA CACGCAAACC TTCGCTGCTG GCGACGATTC CGGTTGGGTA CGGAGACGGG 
TACCTGCGCG CGCTCTCCAA CAAAGGCCGG GCGCTGGTGC GCGGTGAGTA TGCACCGATC 
GCAGGCAATG TTTCCATGGA CCTGACGATC ATTGATGTTT CGCGCATTCC GGGAGTGGCG 
GTGGGCGATG AGGTAACGCT GATCGGGCGC GATGGCGAGA AATCGATCGA AATTGAAGAG 
TTAGCGCGGC ACTATCAGTC CATTGCGTAT GAAGTGATGT GCGGGATATC GAAGCGGGTA 
CCTAGGAAGT ATATCGGCGA ATCTCGCGGC GAGTAA

Protein sequence

MLRPGFFCPE SIIKSVAVSS ADLAVINTRP TWAEVDLSAL RHNYRTLSSH VAPKAQICAV 
VKCDAYGHGA LECAQALEAE GAKWFGVTNP SEALVLRRGG IKGRILLLSG FWQGEEESVL 
EHDFTPAVWT EGHVAWLDAA AKRFGRTKVP VHLKIDTGMS RLGVRWNELP TLLPKLFRAR 
RLSIEGVWSH LASSEVVDAF DAQAQIANFE QALTYLADEG VKWKYRHLAN SAAVAVRPST 
WYDMVRPGLL LYGHCLPLTH TNHVSPDVHL QLALKPVLSW KTRVVDIRRV PAGQGVGYGS 
TFTTRKPSLL ATIPVGYGDG YLRALSNKGR ALVRGEYAPI AGNVSMDLTI IDVSRIPGVA 
VGDEVTLIGR DGEKSIEIEE LARHYQSIAY EVMCGISKRV PRKYIGESRG E