Gene LGAS_1643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	LGAS_1643
Symbol
ID	4439153
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Lactobacillus gasseri ATCC 33323
Kingdom	Bacteria
Replicon accession	NC_008530
Strand	-
Start bp	1605092
End bp	1606525
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	36%
IMG OID	639673468
Product	dipeptidase
Protein accession	YP_815376
Protein GI	116630204
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4690] Dipeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0156326
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAAA GTAAAGATAA CTGTACGGCA ATGATTGTCG GAAAAAAAGC TACAATTGAT 
GGTTCAACTA TCATTGCACG TGATGAAGAC GGTTATGGTG GTATTAATGA AAAGCTTTTT 
GTCGTTCATG AAGCTAAGGA TTATGATGAA GACTATGTAT CAAAGTACAA TGGTTTGAAG 
CTTCACTTAA AGGGGCATGG CTGCAAGTGG ACTGCTACAC CAACAGCAGA TGCTTCAGAA 
GGTCGCTGGG ATGAGCAAGG TATTAACGAA TATAACGTGG CAATGTCAGC TACTGAAACT 
GAAGCAACTA ATGCTCGCTG CTTAGGACAT GATCCTTTAG TTGAAAATGG TGTGGATGAA 
GATTCCATGG TGTATCTTGT TTTACCATTT GTTAAAAGTG CTCGTGAGGG TGTGGCACGT 
TTAGGCAAAT TAATTGAAAA ATATGGTACT GGTGAAAGTA ACGGTATCGC TTTTTCTGAT 
CATGATGAAG TTTGGTATTT CGAAACTGGC GCTGGCCATC AATGGGTTGC CCAAAGAATT 
CCAGAAGATT CTTATGCAAT TTGTCCAAAT ATTATGGTTA TTCAAGATAT TGACTTTGAT 
GACCATGAGA ATTTTATGTA TGCTTCTACA ATTCGTGATT TTGTAGAAAA GAACCATTTA 
AATCCAAGCA CTGATGGTAA GTGGAGCTTT AGAGATATTT TTGGTACTAA AGCTGAAGCT 
GATAGTTATT ACAACACTCC AAGAACTTGG TATGGTCAAA AATTGTTTAA CCCTAGTGTT 
GAACAGGATC CTCTAAGTCA AGAAATGCCA TTTATCAGAA AGCCTGAAAA GAAAATCGGC 
GTTGAAGATG TAGAGTATTT CTTATCAAGT CACTATAACG GGACTGAATA TGATCCAATG 
GGATCTTTTG CTTCTGGGGA TGATAAGGAA CAAAAGATGT TTAGGTCAAT TGCTTTAGAT 
AGAAACCAAT CTAGTTGTAT TCTTCAAATT AGAAATGATG TTCCTAAAGA AATGGCTGCT 
ATTCAATGGG TTAACTTTGG TTTTTATGCT TATAGTCCTT ATGTACCTTT TTATACCAAT 
ATTGATGACA CACCACTTAA CTATCAAAAA GCTAGTCATA TGGTTACACC AGAATCAAGT 
GCTTACTGGC TATATAAGAG TTTACAAGTA TTAATAGAAC CAAGGTATCA TCAATTTATT 
TACCAAGTTG ATAATTTTAG AGATGAATGT CAAAGCTATG CTGTAAGTCG CGTTTCAGCA 
ACTGATGAGA AGGCAAGAGA AATGTCTGGC AAAGAGCAGA CTAAATATTT GACGGCTGCT 
AATGCTGAAA CTGCTGCTCA TATTACTGCT GAAACTAAGA AACTGATTAG TGATTTAACT 
AGACAAGCAT TAAATACATC TAAATTTCAA TTTGAACGCG GCGATAATTT ATAA

Protein sequence

MKKSKDNCTA MIVGKKATID GSTIIARDED GYGGINEKLF VVHEAKDYDE DYVSKYNGLK 
LHLKGHGCKW TATPTADASE GRWDEQGINE YNVAMSATET EATNARCLGH DPLVENGVDE 
DSMVYLVLPF VKSAREGVAR LGKLIEKYGT GESNGIAFSD HDEVWYFETG AGHQWVAQRI 
PEDSYAICPN IMVIQDIDFD DHENFMYAST IRDFVEKNHL NPSTDGKWSF RDIFGTKAEA 
DSYYNTPRTW YGQKLFNPSV EQDPLSQEMP FIRKPEKKIG VEDVEYFLSS HYNGTEYDPM 
GSFASGDDKE QKMFRSIALD RNQSSCILQI RNDVPKEMAA IQWVNFGFYA YSPYVPFYTN 
IDDTPLNYQK ASHMVTPESS AYWLYKSLQV LIEPRYHQFI YQVDNFRDEC QSYAVSRVSA 
TDEKAREMSG KEQTKYLTAA NAETAAHITA ETKKLISDLT RQALNTSKFQ FERGDNL