Gene ECH74115_1944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1944
Symbol	gabT1
ID	6966924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1840373
End bp	1841638
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	58%
IMG OID	643385874
Product	4-aminobutyrate transaminase
Protein accession	YP_002270363
Protein GI	209400873
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0160] 4-aminobutyrate aminotransferase and related aminotransferases
TIGRFAM ID	[TIGR00700] 4-aminobutyrate aminotransferase, prokaryotic type

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	0.991898
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAACA ATGAATTCCA TCAGCGTCGT CTTTCTGCCA CCCCGCGCGG GGTTGGCGTG 
ATGTGTAACT TCTTCGCCCA GTCGGCTGAA AACGCCACGC TGAAGGATGT TGAGGGCAAC 
GAGTACATCG ATTTCGCCGC AGGCATTGCG GTGCTGAATA CCGGACATCG CCACCCTGAT 
CTGGTCGCGG CGGTGGAGCA GCAGCTGCAA CAGTTTACCC ACACCGCGTA TCAGATTGTG 
CCATATGAAA GCTACGTCAC CCTGGCGGAG AAAATCAACG CCCTTGCCCC GGTGAGCGGG 
CAGGCCAAAA CCGCGTTCTT CACCACCGGT GCGGAAGCGG TGGAAAACGC GGTGAAAATC 
GCCCGCGCCC ATACCGGACG CCCTGGCGTG ATTGCGTTTA GCGGCGGCTT CCACGGTCGT 
ACGTATATGA CTATGGCGTT AACTGGAAAG GTCGCGCCGT ACAAAATCGG CTTCGGCCCG 
TTCCCTGGTT CGGTGTATCA CGTACCTTAT CCGTCAGATT TACACGGCAT TTCAACACAG 
GACTCCCTCG ACGCCATCGA ACGCTTGTTT AAATCAGACA TCGAAGCGAA GCAGGTCGCG 
GCCATTATTT TCGAACCGGT GCAGGGCGAG GGCGGTTTCA ACGTTGCGCC AAAAGAGCTG 
GTTGCCGCCA TTCGCCGCCT GTGCGACGAG CACGGTATTG TGATGATTGC CGATGAAGTG 
CAAAGCGGCT TTGCGCGTAC CGGCAAACTG TTTGCGATGG ATCATTACGC CGATAAGCCG 
GACTTAATGA CGATGGCGAA AAGCCTCGCG GGCGGGATGC CGCTTTCGGG TGTGGTCGGT 
AACGCGAATA TTATGGACGC GCCCGCGCCG GGCGGGCTTG GCGGCACCTA CGCCGGGAAT 
CCGCTGGCGG TGGCTGCCGC GCACGCGGTG CTCAACATTA TCGACAAAGA GTCACTCTGT 
GAGCGCGCCA TGCAGTTGGG GCAGCGTCTG ACGAAAACCC TGATTGATGC CAAAGAAAAC 
GTTCCGGCCA TCGCGGCGGT ACGTGGTCTG GGCTCGATGA TTGCGGCAGA ATTTAACGAC 
CCGCAAACGG GCGAGCCGTC AGCCGCCATT GCGCAAAAAA TTCAGCAACG CGCGCTGGCG 
CAGGGACTGC TTCTACTGAC CTGTGGCGCA TACGGCAACG TGATTCGTTT CCTGTATCCG 
CTGACCATCC CGGATGCGCA ATTCGATGCG GCAATGAAAA TTTTGCAGGA TGCGCTGAGA 
GATTAA

Protein sequence

MSNNEFHQRR LSATPRGVGV MCNFFAQSAE NATLKDVEGN EYIDFAAGIA VLNTGHRHPD 
LVAAVEQQLQ QFTHTAYQIV PYESYVTLAE KINALAPVSG QAKTAFFTTG AEAVENAVKI 
ARAHTGRPGV IAFSGGFHGR TYMTMALTGK VAPYKIGFGP FPGSVYHVPY PSDLHGISTQ 
DSLDAIERLF KSDIEAKQVA AIIFEPVQGE GGFNVAPKEL VAAIRRLCDE HGIVMIADEV 
QSGFARTGKL FAMDHYADKP DLMTMAKSLA GGMPLSGVVG NANIMDAPAP GGLGGTYAGN 
PLAVAAAHAV LNIIDKESLC ERAMQLGQRL TKTLIDAKEN VPAIAAVRGL GSMIAAEFND 
PQTGEPSAAI AQKIQQRALA QGLLLLTCGA YGNVIRFLYP LTIPDAQFDA AMKILQDALR 
D