Gene Acid345_0934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0934
Symbol
ID	4070586
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	1187429
End bp	1188829
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	59%
IMG OID	637982941
Product	pyridoxal-dependent decarboxylase
Protein accession	YP_590011
Protein GI	94967963
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0076] Glutamate decarboxylase and related PLP-dependent proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000218274
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000132275
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGCCCCTC TCGACCTCAG CCCCGCAGAT TTCCGCGCCC TTTCCCGCAA AATCTCCGAT 
TTCACCGCCG ATTACCTGGA ACGTCTCCCG AATCTACCTG CCTTCCCGCT AAACGTCTCC 
GGCGAGGCGG TAAATGCTCT CTTTTCCGCG GAAGTCCCGA TCGCACCTAT GGGCGAACGC 
GCCTTCGATC CGCTGGCGGA CGTATTCGCC TTGTCGAGGC CAAACTCCCC GCGTTTCTTC 
GGATACGTCT TCGGTTCCGG CCTCCCGATC GCCGCGCTTG GTGACTTCGC CGCAAGCGTT 
TTGAACCAGA ACGTCACCGC CTGGCGCTCC GGTCCAGCCG CCGTGACCAT CGAACGCACC 
GTCGTTGGCT GGCTCGCCGA AGCCATCGGT TGTTCTGGGT TTTCCGGCAG CCTCACCGGC 
GGAGGCTCAC AAGCCAACCT CATGGCTCTT TGCATGGCCC GCGAAGCGAA AGCGCCCGCC 
AACGAAAACG GAGCCCAAGG TGGAGTGATC TATTGCTCCG ACGAAGCTCA CATGTCCATG 
CCGAAAGCCG CGATGATGCT CGGCCTTGGT CAGAAGAATG TCCGCCGTAT CCCAGTGAAT 
GATCGCTTCC AGATGGACAT CAGTCATCTA CGTGACGCAA TCATGCGTGA TCTCCGGGAA 
GGGAATCGTC CCATCGCCGT TGTCGCCAGC GCTGGAACCG TTGCTACCGG CAGTATCGAT 
CCTCTGCCCG AGATTGCCGA CATCTGCTCC GAACACAACC TCTGGATGCA CGTGGACGGC 
GCCTACGGCG CACTCGCTGC AATGACAGTT CCCGAAAAAT TCGTTGGACT GAATCGTGCT 
GACTCGCTCT CCCTCGACCC GCATAAGTGG CTCTACCAGC CTGCGGGTTG CGGATGTCTC 
CTCTACCGCG ATCCTGCCGC CGCGCAACGC GCGTTCTCGC ATACCGAAGA CTACGCACGC 
TCCCTTTCGA CTGACCCCAT CGAAAGCTTC GCGTTCTTCG AATCGTCCAT GGAACTTTCG 
CGGCCGTTTC GCGCGTTGAA GATATGGCTT TCGCTCCGCT ACTTCGGGCT TCAGGCATTC 
CAGCAGCGCA TCGCCGAAGA CCTTCGCCTT GCCCGCATTC TCGCCGACTC CGTTTCCGCC 
GAGCCGCAAC TCGAACTTCT CGCCCCCGTT GAGCTAAGCG CTGTTTGTTT TCGCTATGTG 
AGGAAAAATG CCGATCTCGA CCACCTGAAC CTCGAGATTC TTCAGCGCAT CATTCAACGA 
GGGAAGGTCT GCATCTCGAA CGCAACCATT CGTGGCCAGT TCGCTCTCCG CGCCTGCGTC 
GTGAATCATC GCAGCACGGA GGAAGACGTT AAGGCTGTCG TAAGTGAGGT CCTACATGCT 
GCGAATGAAG TGAGCGGATG A

Protein sequence

MAPLDLSPAD FRALSRKISD FTADYLERLP NLPAFPLNVS GEAVNALFSA EVPIAPMGER 
AFDPLADVFA LSRPNSPRFF GYVFGSGLPI AALGDFAASV LNQNVTAWRS GPAAVTIERT 
VVGWLAEAIG CSGFSGSLTG GGSQANLMAL CMAREAKAPA NENGAQGGVI YCSDEAHMSM 
PKAAMMLGLG QKNVRRIPVN DRFQMDISHL RDAIMRDLRE GNRPIAVVAS AGTVATGSID 
PLPEIADICS EHNLWMHVDG AYGALAAMTV PEKFVGLNRA DSLSLDPHKW LYQPAGCGCL 
LYRDPAAAQR AFSHTEDYAR SLSTDPIESF AFFESSMELS RPFRALKIWL SLRYFGLQAF 
QQRIAEDLRL ARILADSVSA EPQLELLAPV ELSAVCFRYV RKNADLDHLN LEILQRIIQR 
GKVCISNATI RGQFALRACV VNHRSTEEDV KAVVSEVLHA ANEVSG