Gene Acid345_1982 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1982
Symbol
ID	4069368
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2375798
End bp	2376967
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	58%
IMG OID	637983995
Product	cystathionine beta-lyase
Protein accession	YP_591057
Protein GI	94969009
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01329] cystathionine beta-lyase, eukaryotic

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTCG CTAGCCGTCT CGTAAGTTTC GATCCCGCTC CGGGCGATCG CTATCGCCCC 
ATCGCCACGC CGATATATCA GACGGCAACC TTTGAGCAGG AACACGCCGA TGAATTCGGC 
GAATACGACT ATTCGCGCAG CGGCAATCCC ACGCGCACGG TGCTGGAAAA GCATCTGGCA 
TCGCTGGAAA ACGGGACCCG CGGCTTTTGC TTCTCGAGCG GCATGGCGGC GATAACCACC 
ACGACCAAGC TTCTGCGCTC CGGCGACGAC ATTCTTGCCG ACAGCGATCT CTACGGCGGA 
ACCTGTCGTT TGTTTACCAA AGTCCTCGAG AAGACGGGTA TTTCCGCGCG CTATGCCGAC 
GCCGCGAATC TCGAGCAATT CGCGCAGCAG ATCAGGCCGG AGACGAAGCT GGTCTATGTC 
GAGACGCCGA CGAATCCGCT GCTCCGCGTG CTCGACTTAC GCAAGCTCGC CGAGATAGCT 
CACGCGAATG GCGCGATTCT GTGCGTGGAC AACAGCACGA TGTCGCCGTA CCTGCAGAAT 
CCCCTCGATC TTGGCGCGGA CATAGTGCTG CATTCGGCGA CGAAATATCT CGGCGGCCAT 
CATGATGTGA CGGCTGGCGC GATCGTGGTG AAAGACGAGG AACTGGCGAA GCAGGTCTAT 
TTCATCCAGA ACGCGGAGGG CAATGGACTC TCGCCGTTCG ATTGCTTCCT GCTGCTGCGC 
GGCATTAAGA CCCTAAAGCT GCGCGTGGAT TGCCAGCAGC GCAATGCGCT TACGATCGCG 
AAATTTCTGG CGTCGCATCC AGACGTGAAG AAGGTCTATT ATCCGGGACT TGCCGATCAT 
CCGGGATACG AATTGCAGCG GTCGCAGGCG CGCGGATCCG GAGGCGTATT GAGTTTTACG 
ACTGGCTCGG TGGAAGTTTC GAAAACGGTC GCGGAACTGA CGAAGCTTTT CCGGATTACC 
GTGAGCTTCG GCAGTGTGAA TTCGTCCATC AGCTTGCCGG GGAACATGTC GCATGCGAGC 
GTTCCGCCGC AGGTCTTGGC GCAACGTGAT CTTCCGGCAG ACTTGGTGCG TATCTCGGTC 
GGGATTGAAG ACGAAGAGGA CCTGATTGCC GATCTCGATC AAGCGTTGCA AGTCGCGACG 
GGGAAGACAT TGGCGGCAAG TACGCGGTGA

Protein sequence

MKFASRLVSF DPAPGDRYRP IATPIYQTAT FEQEHADEFG EYDYSRSGNP TRTVLEKHLA 
SLENGTRGFC FSSGMAAITT TTKLLRSGDD ILADSDLYGG TCRLFTKVLE KTGISARYAD 
AANLEQFAQQ IRPETKLVYV ETPTNPLLRV LDLRKLAEIA HANGAILCVD NSTMSPYLQN 
PLDLGADIVL HSATKYLGGH HDVTAGAIVV KDEELAKQVY FIQNAEGNGL SPFDCFLLLR 
GIKTLKLRVD CQQRNALTIA KFLASHPDVK KVYYPGLADH PGYELQRSQA RGSGGVLSFT 
TGSVEVSKTV AELTKLFRIT VSFGSVNSSI SLPGNMSHAS VPPQVLAQRD LPADLVRISV 
GIEDEEDLIA DLDQALQVAT GKTLAASTR