Gene EcolC_0200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0200
Symbol
ID	6065432
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	227075
End bp	228475
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	54%
IMG OID	641599601
Product	glutamate decarboxylase
Protein accession	YP_001723208
Protein GI	170018254
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0076] Glutamate decarboxylase and related PLP-dependent proteins
TIGRFAM ID	[TIGR01788] glutamate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.718769
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCAGA AGCTGTTAAC GGATTTCCGC TCAGAACTAC TCGATTCACG TTTTGGCGCA 
AAGGCCATTT CTACTATCGC GGAGTCAAAA CGATTTCCGC TGCACGAAAT GCGCGATGAT 
GTCGCATTCC AGATTATCAA TGATGAATTA TATCTTGATG GCAACGCTCG TCAGAACCTG 
GCCACTTTCT GCCAGACCTG GGACGACGAA AACGTCCATA AATTGATGGA TTTGTCGATC 
AATAAAAACT GGATCGACAA AGAAGAATAT CCGCAATCCG CAGCCATCGA CCTGCGTTGC 
GTAAATATGG TTGCCGATCT GTGGCATGCG CCTGCGCCGA AAAATGGTCA GGCCGTTGGC 
ACCAACACCA TTGGTTCTTC CGAGGCCTGT ATGCTCGGCG GGATGGCGAT GAAATGGCGT 
TGGCGCAAGC GTATGGAAGC TGCAGGCAAA CCAACGGATA AACCAAACCT GGTGTGCGGT 
CCGGTACAAA TCTGCTGGCA TAAATTCGCC CGCTACTGGG ATGTGGAGCT GCGTGAGATC 
CCTATGCGCC CCGGTCAGTT GTTTATGGAC CCGAAACGCA TGATTGAAGC CTGTGACGAA 
AACACCATCG GCGTGGTGCC GACTTTCGGC GTGACCTACA CCGGTAACTA TGAGTTCCCA 
CAACCGCTGC ACGATGCGCT GGATAAATTC CAGGCCGACA CCGGTATCGA CATCGACATG 
CACATCGACG CTGCCAGCGG TGGCTTCCTG GCACCGTTCG TCGCCCCGGA TATCGTCTGG 
GACTTCCGCC TGCCGCGTGT GAAATCGATC AGTGCTTCAG GCCATAAATT CGGTCTGGCT 
CCGCTGGGCT GCGGCTGGGT TATCTGGCGT GACGAAGAAG CGCTGCCGCA GGAACTGGTG 
TTCAACGTTG ACTACCTGGG TGGTCAAATT GGTACTTTTG CCATCAACTT CTCCCGCCCG 
GCGGGTCAGG TAATTGCACA GTACTATGAA TTCCTGCGCC TCGGTCGTGA AGGCTATACC 
AAAGTACAGA ACGCCTCTTA CCAGGTTGCC GCTTATCTGG CGGATGAAAT CGCCAAACTG 
GGGCCGTATG AGTTCATCTG TACGGGTCGC CCGGACGAAG GCATCCCGGC GGTTTGCTTC 
AAACTGAAAG ATGGTGAAGA TCCGGGATAC ACCCTGTACG ACCTCTCTGA ACGTCTGCGT 
CTGCGCGGCT GGCAGGTTCC GGCCTTCACT CTCGGCGGTG AAGCCACCGA CATCGTGGTG 
ATGCGCATTA TGTGTCGTCG CGGCTTCGAA ATGGACTTTG CTGAACTGTT GCTGGAAGAC 
TACAAAGCCT CCCTGAAATA TCTCAGCGAT CACCCGAAAC TGCAGGGTAT TGCCCAGCAG 
AACAGCTTTA AACACACCTG A

Protein sequence

MDQKLLTDFR SELLDSRFGA KAISTIAESK RFPLHEMRDD VAFQIINDEL YLDGNARQNL 
ATFCQTWDDE NVHKLMDLSI NKNWIDKEEY PQSAAIDLRC VNMVADLWHA PAPKNGQAVG 
TNTIGSSEAC MLGGMAMKWR WRKRMEAAGK PTDKPNLVCG PVQICWHKFA RYWDVELREI 
PMRPGQLFMD PKRMIEACDE NTIGVVPTFG VTYTGNYEFP QPLHDALDKF QADTGIDIDM 
HIDAASGGFL APFVAPDIVW DFRLPRVKSI SASGHKFGLA PLGCGWVIWR DEEALPQELV 
FNVDYLGGQI GTFAINFSRP AGQVIAQYYE FLRLGREGYT KVQNASYQVA AYLADEIAKL 
GPYEFICTGR PDEGIPAVCF KLKDGEDPGY TLYDLSERLR LRGWQVPAFT LGGEATDIVV 
MRIMCRRGFE MDFAELLLED YKASLKYLSD HPKLQGIAQQ NSFKHT