Gene Acid345_2160 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2160
Symbol
ID	4073102
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2579320
End bp	2580759
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	59%
IMG OID	637984176
Product	aromatic-L-amino-acid decarboxylase
Protein accession	YP_591235
Protein GI	94969187
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0076] Glutamate decarboxylase and related PLP-dependent proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.222222
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.771411
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCGCA TGAAGAACAA CTTTCATATG CTTCCTGATG ATTTTCGCGC TGCCGGACAC 
AAAGTGATCG ACTGGGTGGC CGATTATCAC GCGCACGTCG AAGACTTTCG GGTGCTCTCC 
CAAGTGAAGC CCGGGGAGAT TTGCGATGGC TTACCGGACA GTCCGCCTCA GCAGGGGGAC 
TCAGTCACCA ACATCCTTCC GGACATCGAG CGCCATGTCC TGCCGGGCAT CACCCATTGG 
CAGTCGCCGA ACTTCTACGC CTACTTTCCC TCGAACAACT CGGGGCCATC CATCCTCGGA 
GATCTCGTCT CCTCCGGACT CGGAGTGCAG GGGATGTTGT GGGCGACGAG CCCTGCTTGC 
ACCGAAGTCG AGATGAAGAT GCTCGACTGG CTCGTTCAAA TGCTCGGCTT GCCAGAGCAC 
TTCCTCAATT CGTCGAAACA TGGCGGCGGG GTCATCCAGG ACAGCGCTTC AAGCGCAACG 
TTGTGCGCAT TGCTGGCCGC GCGCGAGCAG GCCACGAATG GCCAAACGAA CGAGGAAGGA 
TGCCGACTGC CGCTGGTTTG CTACACCTCA AACCAGGCAC ACTCGCACGT CGAGAAGGAC 
GTGAAGGTCG CCGGCCTCGG CCGCAAGAAC CTGCGTCTGA TTGATGTTGA CCAAGAATTT 
GCAATGCGTC CCGAAGCGCT CGAACGTCAG ATCGTCGAAG ACAAAGCGGC AGGGAAGATC 
CCTTTCTTTG TCTGCGCGAC CATCGGCACA ACTTCCAGCC TTGCGATCGA TCCGATCCCG 
GAGATTGCTG CCATCTGTAA GCGGCACGGT CTCTGGCTAC ACGTGGATGC CGCCATGGCG 
GGGACGGCAG CGCTTTGTCC TGAATTTCGC TGGACGCACA ACGGCGTCGA ACTGGCCGAC 
AGTTACGCCT TCAACCCGCA TAAGTGGATG TACACCAACT TCGACTGCAC CGCCTTCTGG 
GTCAAGGATC GGCACGCGTT GATCAACAGC TTGAGCGTCG TGCCGGAATA CCTGCGCAAC 
CAGGCGTCCG AACAAGGCGA GGTCTTTGAT TATCGCGATT GGCACGTGCC CCTGGGACGC 
CGCTTCCGCG CCCTGAAGCT ATGGTTCGTG ATCCGACACT ATGGCGTCGA AGGCCTGCAA 
CATCACGTGC GGCAGAATGT CGCATGGGCG CAGGAATTTG CCGCGTGGGT CAAGGCGGAT 
TCGCGTTTCG AACTGGTCGC ACCCCACCCG CTGAGTCTCG TGTGCTTCCG ACTGAAAAGC 
GGCGACGCCG CCAGCGAACA GCTGCTGAAG CGCGCGAATG AAAGCGGGAA GATATTCATC 
TCGCACACCA AGCTCGACGG CAAATATGTG CTTCGGTTCT CGATCGGGCA GGCGAAAACC 
GAACGGCATC ACGTCGAAGC GGCCTGGAAA TTGATTAGCG ATCTTGCAGA TCGGTCCTAG

Protein sequence

MNRMKNNFHM LPDDFRAAGH KVIDWVADYH AHVEDFRVLS QVKPGEICDG LPDSPPQQGD 
SVTNILPDIE RHVLPGITHW QSPNFYAYFP SNNSGPSILG DLVSSGLGVQ GMLWATSPAC 
TEVEMKMLDW LVQMLGLPEH FLNSSKHGGG VIQDSASSAT LCALLAAREQ ATNGQTNEEG 
CRLPLVCYTS NQAHSHVEKD VKVAGLGRKN LRLIDVDQEF AMRPEALERQ IVEDKAAGKI 
PFFVCATIGT TSSLAIDPIP EIAAICKRHG LWLHVDAAMA GTAALCPEFR WTHNGVELAD 
SYAFNPHKWM YTNFDCTAFW VKDRHALINS LSVVPEYLRN QASEQGEVFD YRDWHVPLGR 
RFRALKLWFV IRHYGVEGLQ HHVRQNVAWA QEFAAWVKAD SRFELVAPHP LSLVCFRLKS 
GDAASEQLLK RANESGKIFI SHTKLDGKYV LRFSIGQAKT ERHHVEAAWK LISDLADRS