Gene EcSMS35_1820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1820
Symbol	gabT1
ID	6143459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1839045
End bp	1840310
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	58%
IMG OID	641616696
Product	4-aminobutyrate transaminase
Protein accession	YP_001743874
Protein GI	170682308
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0160] 4-aminobutyrate aminotransferase and related aminotransferases
TIGRFAM ID	[TIGR00700] 4-aminobutyrate aminotransferase, prokaryotic type

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.144249
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAACA ATGAATTCCA TCAGCGTCGT CTTTCTGCTA CCCCTCGCGG GGTTGGCGTG 
ATGTGTAACT TCTTCGCCCA GTCGGCAGAA AACGCCATGC TGAAGGACGT AGAGGGCAAC 
GAATACATCG ATTTCGCCGC AGGCATTGCG GTGCTGAATA CCGGGCATCG CCACCCTGAT 
CTGGTCGCGG CGGTGGAGCA GCAATTGCAA CAGTTTACCC ACACGGCGTA TCAGATTGTG 
CCGTACGAAA GCTACGTCAC CCTGGCGGAG AAAATCAACG CCCTTGCCCC GGTGAGCGGG 
CAGGCTAAAA CTGCGTTCTT CACCACCGGT GCGGAAGCGG TGGAGAACGC GGTGAAAATC 
GCCCGCGCCC ATACCGGACG CCCTGGCGTG ATTGCGTTTA GCGGCGGCTT CCACGGTCGT 
ACATATATGA CCATGGCGCT GACCGGAAAG GTCGCGCCGT ACAAAATCGG CTTCGGCCCG 
TTCCCCGGTT CGGTATATCA CGTACCTTAT CCGTCAGATT TACATGGCGT TTCAACGCAG 
GACTCTCTCG ACGCCATCGA ACGCTTGTTT AAATCTGACA TTGAAGCGAA GCAGGTGGCG 
GCGATTATTT TCGAACCGGT GCAGGGCGAA GGCGGTTTCA ACGTTGCACC AAAAGAGCTG 
GTTGCCGCCA TTCGCCGCCT GTGCGACGAG CACGGCATTG TGATGATTGC CGATGAAGTG 
CAAAGCGGCT TTGCGCGTAC CGGTAAACTG TTTGCCATGG ATCACTACGC CGATAAGCCG 
GACTTAATGA CGATGGCGAA AAGCCTCGCG GGCGGCATGC CGCTTTCGGG CGTGGTCGGT 
AACGCGAATA TTATGGACGC GCCCGCGCCG GGCGGGTTGG GTGGTACTTA CGCCGGGAAC 
CCGCTGGCGG TGGCTGCCGC GCACGCTGTG CTCAACATTA TCGACAAAGA ATCACTCTGT 
GAACGCGCGA ATCAACTGGG CCAGCGCCTG ACAAACACGT TGATTGATGC CAAAGAAAGC 
GTTCCGGCCA TCGCGGCGGT ACGCGGTCTG GGGTCTATGA TTGCGGCAGA GTTTAACGAT 
CCGCAAACGG GCGAGCCGTC AGCGGCGATT GCACAGAAAA TCCAGCAACG CGCGCTGGCG 
CAGGGGCTGC TTCTGCTGAC CTGTGGCGCA TACGGCAACG TGATTCGTTT CCTGTATCCG 
CTGACCATCC CGGATGCGCA ATTCGATGCG GCAATGAAAA TTTTGCAGGA TGCGCTGAAA 
GATTAA

Protein sequence

MSNNEFHQRR LSATPRGVGV MCNFFAQSAE NAMLKDVEGN EYIDFAAGIA VLNTGHRHPD 
LVAAVEQQLQ QFTHTAYQIV PYESYVTLAE KINALAPVSG QAKTAFFTTG AEAVENAVKI 
ARAHTGRPGV IAFSGGFHGR TYMTMALTGK VAPYKIGFGP FPGSVYHVPY PSDLHGVSTQ 
DSLDAIERLF KSDIEAKQVA AIIFEPVQGE GGFNVAPKEL VAAIRRLCDE HGIVMIADEV 
QSGFARTGKL FAMDHYADKP DLMTMAKSLA GGMPLSGVVG NANIMDAPAP GGLGGTYAGN 
PLAVAAAHAV LNIIDKESLC ERANQLGQRL TNTLIDAKES VPAIAAVRGL GSMIAAEFND 
PQTGEPSAAI AQKIQQRALA QGLLLLTCGA YGNVIRFLYP LTIPDAQFDA AMKILQDALK 
D