Gene EcHS_A1417 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1417
Symbol	gabT1
ID	5592396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1413003
End bp	1414268
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	58%
IMG OID	640920572
Product	4-aminobutyrate transaminase
Protein accession	YP_001458131
Protein GI	157160813
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0160] 4-aminobutyrate aminotransferase and related aminotransferases
TIGRFAM ID	[TIGR00700] 4-aminobutyrate aminotransferase, prokaryotic type

Plasmid Coverage information

Num covering plasmid clones	66
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAACA ATGAATTCCA TCAGCGTCGT CTTTCTGCCA CCCCGCGCGG GGTTGGCGTG 
ATGTGTAACT TCTTCGCCCA GTCGGCTGAA AACGCTACGC TGAAGGATGT TGAGGGCAAC 
GAGTACATCG ATTTCGCCGC AGGCATTGCG GTGCTGAATA CCGGGCATCG CCACCCTGAT 
CTGGTCGCGG CGGTGGAGCA GCAACTGCAA CAGTTTACCC ACACCGCGTA TCAGATTGTG 
CCGTATGAAA GCTACGTCAC CCTGGCGGAG AAAATCAACG CCCTTGCCCC GGTGAGCGGG 
CAGGCCAAAA CCGCGTTCTT CACTACCGGC GCGGAAGCGG TGGAAAACGC GGTGAAAATG 
GCTCGCGCCC ATACCGGACG ACCTGGCGTG ATTGCGTTTA GCGGTGGCTT CCACGGTCGT 
ACATATATGA CCATGGCGCT GACCGGAAAA GTTGCGCCGT ACAAAATCGG CTTCGGCCCG 
TTCCCTGGTT CGGTGTATCA CGTACCTTAT CCGTCAGATT TACACGGCAT TTCAACACAG 
GACTCCCTCG ACGCCATCGA ACGCTTGTTT AAATCAGACA TCGAAGCGAA GCAGGTCGCG 
GCCATTATTT TCGAACCGGT GCAGGGCGAG GGCGGTTTCA ACGTTGCGCC AAAAGAGCTG 
GTTGCCGCCA TTCGCCGCCT GTGCGACGAG CACGGTATTG TGATGATTGC CGATGAAGTG 
CAAAGCGGCT TTGCGCGTAC CGGTAAACTG TTTGCCATGG ATCATTACGC CGATAAGCCG 
GACTTAATGA CGATGGCGAA AAGCCTCGCG GGCGGGATGC CGCTTTCGGG CGTGGTCGGT 
AACGCGAATA TTATGGACGC GCCCGCGCCG GGCGGGTTGG GTGGCACCTA CGCCGGGAAC 
CCGCTGGCGG TGGCTGCCGC GCACGCGGTG CTCAATATTA TCGACAAAGA ATCACTCTGC 
AAACGCGCGA ATCAACTGGG CCAGCGTCTC AAAAACACGT TGATTGATGC CAAAGAAAGC 
GTTCCGGCCA TTGCTGCGGT ACGCGGCCTG GGGTCGATGA TTGCGGCAGA GTTTAACGAT 
CCGCAAACGG GCGAGCCGTC AGCGGCGATT GCACAGAAAA TCCAGCAACG CGCGCTGGCG 
CAGGGGCTGC TCCTGCTGAC CTGTGGCGCA TACGGCAACG TGATTCGCTT CCTGTATCCG 
CTGACCATCC CGGATGCGCA ATTCGATGCG GCAATGAAAA TTTTGCAGGA TGCGCTGAGC 
GATTAA

Protein sequence

MSNNEFHQRR LSATPRGVGV MCNFFAQSAE NATLKDVEGN EYIDFAAGIA VLNTGHRHPD 
LVAAVEQQLQ QFTHTAYQIV PYESYVTLAE KINALAPVSG QAKTAFFTTG AEAVENAVKM 
ARAHTGRPGV IAFSGGFHGR TYMTMALTGK VAPYKIGFGP FPGSVYHVPY PSDLHGISTQ 
DSLDAIERLF KSDIEAKQVA AIIFEPVQGE GGFNVAPKEL VAAIRRLCDE HGIVMIADEV 
QSGFARTGKL FAMDHYADKP DLMTMAKSLA GGMPLSGVVG NANIMDAPAP GGLGGTYAGN 
PLAVAAAHAV LNIIDKESLC KRANQLGQRL KNTLIDAKES VPAIAAVRGL GSMIAAEFND 
PQTGEPSAAI AQKIQQRALA QGLLLLTCGA YGNVIRFLYP LTIPDAQFDA AMKILQDALS 
D