Gene ECH74115_1983 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1983
Symbol	abgT
ID	6970902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	1875421
End bp	1876953
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	50%
IMG OID	643385907
Product	putative aminobenzoyl-glutamate transporter
Protein accession	YP_002270396
Protein GI	209399301
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2978] Putative p-aminobenzoyl-glutamate transporter
TIGRFAM ID	[TIGR00819] p-Aminobenzoyl-glutamate transporter family

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.328307
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCATGA GTATGTCATC CATACCGTCG TCCTCCCAAT CCGGGAAGCT CTATGGCTGG 
GTCGAAAGAA TTGGTAACAA GGTTCCCCAT CCTTTTTTGC TCTTTATCTA TTTGATTATC 
GTACTCATGG TGACGACGGC AATTTTGTCG GCCTTTGGCG TCAGTGCGAA AAACCCGACC 
GATGGTACGC CGGTGGTGGT GAAAAACCTG CTCAGTGTGG AAGGATTACA CTGGTTTTTA 
CCCAATGTTA TTAAAAACTT TAGCGGTTTT GCTCCACTTG GTGCGATCCT GGCGCTGGTT 
TTAGGTGCCG GTCTGGCGGA GCGCGTCGGC TTACTGCCAG CACTAATGGT TAAAATGGCA 
TCGCATGTTA ATGCCCGCTA CGCCAGTTAT ATGGTGCTGT TTATTGCTTT TTTCAGCCAC 
ATTTCTTCCG ATGCGGCGTT AGTGATCATG CCACCGATGG GTGCGCTGAT TTTTCTGGCG 
GTGGGCAGGC ATCCAGTTGC AGGTTTACTG GCTGCCATTG CAGGCGTAGG TTGCGGCTTT 
ACGGCTAATT TACTGATTGT CACAACCGAC GTGTTGCTGT CGGGGATCAG CACGGAAGCG 
GCAGCTGCGT TCAATCCGCA AATGCACGTC AGTGTAATTG ATAACTGGTA TTTTATGGCC 
AGCTCCGTAG TCGTACTGAC GATTGTTGGC GGCCTGATAA CCGACAAAAT CATCGAGCCA 
CGGTTAGGTC AATGGCAGGG AAACAGCGAT GAGAAACTGC AGACATTGAC CGAAAGTCAG 
CGTTTTGGTT TACGCATAGC AGGTGTCGTA TCGCTACTTT TTATTGCTGC GATTGCGCTG 
ATGGTGATCC CGGAAAACGG GATATTGCGC GATCCGATTA ATCACACCGT GATGCCATCA 
CCCTTTATTA AAGGTATCGT GCCACTGATC ATTCTTTTTT TCTTTGTTGT CTCGCTGGCT 
TATGGCATCG CTACCCGCAC AATTCGACGT CAGGCGGATT TACCGCATTT AATGATTGAA 
CCGATGAAAG AGATGGCGGG ATTTATCGTG ATGGTTTTTC CCCTCGCCCA GTTTGTCGCC 
ATGTTTAACT GGAGCAACAT GGGGAAATTC ATCGCCGTGG GGCTGACCGA TATCCTGGAA 
AGTTCAGGGC TTAGCGGCAT CCCGGCGTTT GTCGGTCTGG CGTTGCTTTC CTCTTTCTTA 
TGCATGTTTA TCGCCAGCGG TTCCGCAATC TGGTCGATTC TGGCCCCCAT TTTCGTACCA 
ATGTTTATGC TACTTGGCTT TCACCCGGCA TTTGCGCAAA TCCTCTTTCG TATTGCCGAC 
TCATCCGTAT TGCCTTTAGC GCCAGTATCT CCTTTTGTTC CACTGTTTCT TGGATTCCTG 
CAACGCTACA AACCAGACGC GAAACTGGGT ACTTACTATT CGTTAGTCTT GCCCTATCCG 
CTTATCTTTT TGGTGGTATG GCTGCTGATG TTGCTGGCGT GGTATCTTGT GGGCCTGCCG 
ATAGGTCCGG GTATTTACCC ACGTTTGTCT TAA

Protein sequence

MPMSMSSIPS SSQSGKLYGW VERIGNKVPH PFLLFIYLII VLMVTTAILS AFGVSAKNPT 
DGTPVVVKNL LSVEGLHWFL PNVIKNFSGF APLGAILALV LGAGLAERVG LLPALMVKMA 
SHVNARYASY MVLFIAFFSH ISSDAALVIM PPMGALIFLA VGRHPVAGLL AAIAGVGCGF 
TANLLIVTTD VLLSGISTEA AAAFNPQMHV SVIDNWYFMA SSVVVLTIVG GLITDKIIEP 
RLGQWQGNSD EKLQTLTESQ RFGLRIAGVV SLLFIAAIAL MVIPENGILR DPINHTVMPS 
PFIKGIVPLI ILFFFVVSLA YGIATRTIRR QADLPHLMIE PMKEMAGFIV MVFPLAQFVA 
MFNWSNMGKF IAVGLTDILE SSGLSGIPAF VGLALLSSFL CMFIASGSAI WSILAPIFVP 
MFMLLGFHPA FAQILFRIAD SSVLPLAPVS PFVPLFLGFL QRYKPDAKLG TYYSLVLPYP 
LIFLVVWLLM LLAWYLVGLP IGPGIYPRLS