Gene EcSMS35_3820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3820
Symbol	gadB
ID	6145366
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3886816
End bp	3888216
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	54%
IMG OID	641618646
Product	glutamate decarboxylase GadB
Protein accession	YP_001745786
Protein GI	170679884
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0076] Glutamate decarboxylase and related PLP-dependent proteins
TIGRFAM ID	[TIGR01788] glutamate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.143383
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCAGA AGCTGTTAAC GGATTTCCGC TCAGAACTAC TCGATTCACG TTTTGGCGCA 
AAGGCCATTT CTACTATCGC GGAGTCAAAA CGATTTCCGC TGCACGAAAT GCGAGATGAT 
GTTGCATTTC AGATTATCAA TGATGAATTA TATCTTGATG GCAACGCTCG TCAGAACCTG 
GCCACTTTCT GCCAGACCTG GGACGACGAA AACGTCCATA AATTGATGGA TTTGTCGATC 
AATAAAAACT GGATCGACAA AGAAGAATAT CCGCAATCTG CAGCCATCGA CCTGCGTTGC 
GTAAACATGG TTGCCGATCT GTGGCATGCG CCTGCACCGA AAAATGGTCA GGCCGTTGGC 
ACCAACACCA TTGGTTCTTC CGAGGCCTGT ATGCTCGGCG GGATGGCGAT GAAATGGCGT 
TGGCGCAAGC GTATGGAAGC CGCAGGTAAG CCGACCAACA AACCAAACCT GGTGTGCGGT 
CCGGTACAAA TCTGCTGGCA TAAATTCGCC CGCTACTGGG ATGTGGAGCT GCGTGAGATC 
CCTATGCGCC CCGGTCAGTT GTTTATGGAC CCGAAACGCA TGATTGAAGC CTGCGACGAA 
AACACCATCG GCGTGGTGCC GACTTTTGGC GTGACCTACA CCGGTAACTA TGAGTTCCCA 
CAGCCGCTGC ACGATGCGCT GGATAAATTC CAGGCCGACA CCGGTATCGA CATCGACATG 
CACATCGACG CTGCCAGCGG TGGCTTCCTG GCACCGTTCG TCGCCCCGGA TATCGTCTGG 
GACTTCCGCC TGCCGCGTGT GAAATCGATC AGTGCTTCAG GCCATAAATT CGGTCTGGCT 
CCGCTGGGCT GCGGCTGGGT TATCTGGCGT GATGAAGAAG CGCTGCCGCA GGAACTGGTG 
TTCAACGTTG ACTATCTGGG TGGTCAGATT GGGACTTTCG CCATCAACTT CTCCCGCCCG 
GCAGGTCAGG TGATTGCACA GTACTATGAA TTCCTGCGCC TTGGCCGTGA AGGCTATACC 
AAAGTACAGA ACGCTTCCTA CCAGGTTGCT GCCTATCTGG CGGATGAAAT CGCCAAACTG 
GGGCCGTATG AGTTCATCTG TACCGGTCGC CCGGACGAAG GCATCCCGGC GGTTTGCTTC 
AAACTGAAAG ATGGTGAAGA CCCGGGATAC ACCCTCTACG ACCTCTCTGA ACGTCTGCGC 
CTGCGCGGCT GGCAGGTTCC GGCCTTCACT CTCGGCGGTG AAGCCACTGA CATCGTGGTG 
ATGCGCATTA TGTGTCGTCG CGGCTTCGAA ATGGACTTTG CTGAACTGTT GCTGGAAGAC 
TACAAAGCCT CCCTGAAATA TCTCAGCGAT CACCCGAAAC TGCAGGGTAT TGCCCAGCAG 
AACAGCTTTA AACATACCTG A

Protein sequence

MDQKLLTDFR SELLDSRFGA KAISTIAESK RFPLHEMRDD VAFQIINDEL YLDGNARQNL 
ATFCQTWDDE NVHKLMDLSI NKNWIDKEEY PQSAAIDLRC VNMVADLWHA PAPKNGQAVG 
TNTIGSSEAC MLGGMAMKWR WRKRMEAAGK PTNKPNLVCG PVQICWHKFA RYWDVELREI 
PMRPGQLFMD PKRMIEACDE NTIGVVPTFG VTYTGNYEFP QPLHDALDKF QADTGIDIDM 
HIDAASGGFL APFVAPDIVW DFRLPRVKSI SASGHKFGLA PLGCGWVIWR DEEALPQELV 
FNVDYLGGQI GTFAINFSRP AGQVIAQYYE FLRLGREGYT KVQNASYQVA AYLADEIAKL 
GPYEFICTGR PDEGIPAVCF KLKDGEDPGY TLYDLSERLR LRGWQVPAFT LGGEATDIVV 
MRIMCRRGFE MDFAELLLED YKASLKYLSD HPKLQGIAQQ NSFKHT