Gene ECH74115_3904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3904
Symbol	gabT2
ID	6970839
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3619158
End bp	3620438
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	58%
IMG OID	643387678
Product	4-aminobutyrate aminotransferase
Protein accession	YP_002272126
Protein GI	209398707
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0160] 4-aminobutyrate aminotransferase and related aminotransferases
TIGRFAM ID	[TIGR00700] 4-aminobutyrate aminotransferase, prokaryotic type

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	0.888156
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGCA ATAAAGAGTT AATGCAGCGC CGCAGTCAGG CAATTCCTCG TGGCGTTGGG 
CAAATTCACC CCATTTTCGC TGATCGCGCG GAAAACTGCC GGGTGTGGGA CGTTGAAGGC 
CGTGAGTATC TTGATTTCGC GGGCGGCATT GCGGTGCTCA ATACCGGGCA CCTGCATCCG 
AAAGTGGTTG CCGCGGTGGA AGCGCAGTTG AAAAAACTGT CGCACACCTG CTTCCAGGTG 
CTGGCTTACG AGCCGTATCT GGAGCTGTGC GAGATTATGA ATCAGAAGGT GCCGGGCGAT 
TTTGCCAAGA AAACGCTGCT GGTTACGACC GGTTCCGAAG CGGTGGAAAA CGCGGTGAAA 
ATCGCCCGCG CTGCCACCAA ACGTAGCGGC ACCATCGCTT TTAGCGGCGC GTATCACGGG 
CGCACGCATT ACACGCTGGC GCTGACCGGC AAGGTGAATC CGTACTCTGC GGGCATGGGC 
CTGATGCCAG GGCACGTTTA TCGCGCGCTT TATCCTTGCC CACTGCACGG CATCAGTGAA 
GATGATGCTA TCGCCAGTAT CCACCGAATT TTTAAAAATG ATGCTGCGCC GGAAGATATC 
GCCGCCATCG TGATTGAGCC GGTTCAGGGC GAAGGCGGTT TCTACGCCGC GACGCCTGCG 
TTTATGCAGC GTTTACGCGC GCTGTGTGAC GAGCACGGGA TCATGCTGAT TGCCGATGAA 
GTGCAGAGCG GCGCGGGGCG TACCGGCACG CTGTTTGCGA TGGAGCAAAT GGGCGTGGCA 
CCAGATCTCA CCACCTTTGC GAAATCGATC GCAGGCGGCT TCCCACTGGC GGGCGTCACC 
GGGCGCGCCG AAGTGATGGA TGCCGTCGCT CCAGGCGGGC TGGGTGGCAC CTATGCCGGT 
AATCCGATTG CCTGCGTGGC GGCGCTGGAA GTGTTGAAGG TGTTCGAGCA GGAAAATCTG 
CTGCAGAAAG CCAACGATCT GGGGCAGAAG TTGAAAGATG GATTGTTGGC GATCGCCGAA 
AAACACCCTG AGATCGGCGA CGTACGCGGG CTGGGGGCGA TGATCGCCAT CGAGCTGTTT 
GAAGACGGCG ATCACAACAA GCCGGACGCC AAACTCACCG CCGAGATCGT GGCTCGCGCC 
CGCGATAAAG GCCTGATTCT TCTCTCCTGC GGCCCGTATT ACAACGTGCT GCGCATCCTT 
GTACCGCTCA CCATTGAAGA CGCTCAGATC CGTCAGGGTC TGGAGATCAT CAGCCAGTGT 
TTTGCTGAGG CAAAGCAGTA G

Protein sequence

MSSNKELMQR RSQAIPRGVG QIHPIFADRA ENCRVWDVEG REYLDFAGGI AVLNTGHLHP 
KVVAAVEAQL KKLSHTCFQV LAYEPYLELC EIMNQKVPGD FAKKTLLVTT GSEAVENAVK 
IARAATKRSG TIAFSGAYHG RTHYTLALTG KVNPYSAGMG LMPGHVYRAL YPCPLHGISE 
DDAIASIHRI FKNDAAPEDI AAIVIEPVQG EGGFYAATPA FMQRLRALCD EHGIMLIADE 
VQSGAGRTGT LFAMEQMGVA PDLTTFAKSI AGGFPLAGVT GRAEVMDAVA PGGLGGTYAG 
NPIACVAALE VLKVFEQENL LQKANDLGQK LKDGLLAIAE KHPEIGDVRG LGAMIAIELF 
EDGDHNKPDA KLTAEIVARA RDKGLILLSC GPYYNVLRIL VPLTIEDAQI RQGLEIISQC 
FAEAKQ