Gene Acid345_3040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3040
Symbol
ID	4071947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3608644
End bp	3610089
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	60%
IMG OID	637985059
Product	D-glutamate deacylase
Protein accession	YP_592115
Protein GI	94970067
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.236527
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCGTCG CATGCGCCCT TTTTGCTGTC GTCGTCCACT TCCATTCACT TCGCGCCAAT 
GCGAGCGGGC GGCCGTATGA CGTCGTGATC TTGAACGGGC GCGTCATGGA TCCCGAGTCG 
GGGCTCGATG CGATGCGGAA TGTCGGAATT CGCCACGGGA AGATCGTTGC AGTTTCGACT 
GCGGCGATTA CCGGGAAGCG CACGATTGAC GCTAAAGGGT TGGTGGTGGC ACCCGGCTTC 
ATCGACATGC ATGAGCATGG GCAGGAGCCG CGCAATTACC AGTTCCAGGC CCACGATGGA 
GTAACGACTT CGCTCGAGTT GGAAGTTGGG ACCGACGATG TTGCGCAGTG GTACGCGAAT 
CGCGAAGGGA AGGCGCTGAT CAATTATGGC GTGAGCATTG GGCATATCCC GGTGCGAATG 
AAGGTGCTGA AAGATCCCGG AAAATGGCTA CCTACAGGTG ACGCGGAGTA CCGTGCTTCT 
ACTTCGGAAG AGCTTGCCGA AATCCAACAG AGGATTCAGG CAGGGTTGGA CGCGGGAGCG 
CTCGCAGTGG GAATGGGGAT TAACTACACG GCGGCTGCGT CACACGAGGA GATCGTGGAC 
ATGTTTCGGA TTGCTGCGAA GAACGGCGCG CCGGTGCATG TGCATTTGCG GTGGGCGGGA 
ATCAAAGAGC CGGAGACCGG ACTGGCTGGG CTGGAAGAAG TGATTGCGGC GGCGGAGTCT 
ACGGGTGCGC CTCTGCACGT GGTGCATGTC ACCAGCATGG GGCTGCGCGA CACACCACAG 
TTGATTGCGA TGATCGAAGG TGCGCAGAAG CGTGGGTTGG ATGTGACCAC GGAGTGCTAT 
CCGTACATTG CCGCAAGTAC AGGGCTGGAG AGTGCGATAT TTGAGCCCGG ATGGCAGGAG 
AAGATGGGGA TCACGTACAA GGACCTGCAA TGGGTGGGCA CAGGCGAGCG ACTGACGCAG 
GAGACATTCG CGAAATATCG GAAGCAAGGC GGGCCGGCGG TGATCTTCTC GATTCCAGAA 
GCGGCGGCGA GAACCGCGGT CGCGAATCCG ATGGTGATGA TCGCGAGCGA TGGGCCGCAG 
TTCACTGGGC CGAAGGTGCA TCCGCGCGGG AACGGGACGT TTTCACGTGT GCTGGGACAC 
TACGTGCGCG AGGAACATGC GCTCGATTTG ATGACCGCGC TGAGAAAAAT GACCTTGATG 
CCGGCGCAAC GGTTGGAGAA ACGGACGCCG GAATTCAAGA ACAAAGGCCG CATTCGCGTA 
GGCGCTGATG CCGACATCAC CGTGTTCGAT CCGCAACGCG TGATTGATAA AGCGACGTTT 
GAAGAGCCGA TGCAGTATTC CGCGGGGATT CAGTTCGTGC TGGTGAATGG AGTGCCCGTG 
GTGAGTGACG GCAACCTCGC GGAGGGAGTC TTCCCGGGAC GTGCGGCGCG CGCGCCCGTG 
CACTAG

Protein sequence

MIVACALFAV VVHFHSLRAN ASGRPYDVVI LNGRVMDPES GLDAMRNVGI RHGKIVAVST 
AAITGKRTID AKGLVVAPGF IDMHEHGQEP RNYQFQAHDG VTTSLELEVG TDDVAQWYAN 
REGKALINYG VSIGHIPVRM KVLKDPGKWL PTGDAEYRAS TSEELAEIQQ RIQAGLDAGA 
LAVGMGINYT AAASHEEIVD MFRIAAKNGA PVHVHLRWAG IKEPETGLAG LEEVIAAAES 
TGAPLHVVHV TSMGLRDTPQ LIAMIEGAQK RGLDVTTECY PYIAASTGLE SAIFEPGWQE 
KMGITYKDLQ WVGTGERLTQ ETFAKYRKQG GPAVIFSIPE AAARTAVANP MVMIASDGPQ 
FTGPKVHPRG NGTFSRVLGH YVREEHALDL MTALRKMTLM PAQRLEKRTP EFKNKGRIRV 
GADADITVFD PQRVIDKATF EEPMQYSAGI QFVLVNGVPV VSDGNLAEGV FPGRAARAPV 
H