Gene EcDH1_2872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2872
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	3077799
End bp	3079232
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	50%
IMG OID
Product	anion transporter
Protein accession	ACX40505
Protein GI	260450083
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.675436
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAGA AATCGTTATG GAAGCTAATT CTGATATTAG CGATCCCATG TATTATTGGT 
TTTATGCCAG CTCCGGCAGG ATTAAGCGAA CTGGCGTGGG TGCTTTTTGG TATTTACCTG 
GCGGCCATTG TGGGGCTGGT TATCAAGCCT TTCCCGGAAC CTGTCGTACT GTTAATTGCC 
GTTGCTGCCT CAATGGTGGT GGTCGGTAAC TTATCCGACG GTGCGTTTAA AACCACCGCC 
GTATTAAGCG GTTACTCTTC AGGTACCACC TGGCTGGTGT TCTCGGCGTT TACCTTAAGC 
GCCGCATTTG TGACCACCGG TTTAGGTAAA CGTATTGCCT ATCTGCTGAT TGGTAAAATC 
GGTAACACCA CGCTGGGTCT GGGTTACGTT ACGGTATTCC TCGATCTGGT ACTGGCTCCG 
GCAACACCGT CTAACACCGC GCGTGCGGGC GGCATTGTGT TACCGATCAT CAACAGCGTG 
GCGGTGGCTT TGGGGTCCGA ACCGGAAAAA AGTCCGCGTC GTGTCGGACA TTACCTGATG 
ATGTCCATTT ACATGGTCAC CAAAACCACC AGCTATATGT TCTTTACCGC AATGGCGGGG 
AACATTCTGG CGCTGAAAAT GATCAACGAC ATTCTGCACC TGCAAATTAG CTGGGGTGGA 
TGGGCGCTGG CAGCCGGATT GCCGGGCATC ATTATGCTGC TGGTCACCCC GCTGGTGATT 
TACACCATGT ATCCACCAGA AATTAAGAAG GTGGATAACA AAACCATCGC TAAAGCGGGC 
CTTGCCGAAC TAGGACCGAT GAAAATCCGC GAAAAAATGC TGCTCGGTGT CTTTGTGCTG 
GCGCTGCTGG GCTGGATTTT CAGTAAGTCT CTGGGGGTTG ATGAATCCAC CGTGGCAATC 
GTTGTTATGG CAACCATGCT GCTGCTGGGT ATCGTTACCT GGGAAGACGT GGTTAAAAAT 
AAAGGCGGCT GGAATACCTT AATCTGGTAC GGCGGTATTA TCGGCTTAAG CTCCTTATTA 
TCGAAAGTTA AATTCTTCGA ATGGTTAGCT GAAGTCTTTA AAAATAACCT GGCATTTGAT 
GGTCACGGTA ACGTTGCTTT CTTCGTTATT ATTTTCCTCA GCATTATCGT GCGTTATTTC 
TTCGCTTCCG GTAGTGCCTA TATCGTTGCT ATGTTACCGG TATTTGCCAT GCTGGCGAAC 
GTCTCCGGCG CACCGTTAAT GTTAACCGCG CTGGCACTGT TGTTCTCCAA CTCCTATGGC 
GGCATGGTTA CTCACTATGG CGGCGCGGCA GGTCCGGTCA TCTTTGGCGT GGGTTATAAC 
GATATTAAAT CCTGGTGGTT GGTCGGTGCG GTACTGACGA TATTAACCTT CCTGGTGCAT 
ATCACCCTCG GCGTGTGGTG GTGGAATATG CTGATCGGCT GGAACATGCT GTAA

Protein sequence

MNKKSLWKLI LILAIPCIIG FMPAPAGLSE LAWVLFGIYL AAIVGLVIKP FPEPVVLLIA 
VAASMVVVGN LSDGAFKTTA VLSGYSSGTT WLVFSAFTLS AAFVTTGLGK RIAYLLIGKI 
GNTTLGLGYV TVFLDLVLAP ATPSNTARAG GIVLPIINSV AVALGSEPEK SPRRVGHYLM 
MSIYMVTKTT SYMFFTAMAG NILALKMIND ILHLQISWGG WALAAGLPGI IMLLVTPLVI 
YTMYPPEIKK VDNKTIAKAG LAELGPMKIR EKMLLGVFVL ALLGWIFSKS LGVDESTVAI 
VVMATMLLLG IVTWEDVVKN KGGWNTLIWY GGIIGLSSLL SKVKFFEWLA EVFKNNLAFD 
GHGNVAFFVI IFLSIIVRYF FASGSAYIVA MLPVFAMLAN VSGAPLMLTA LALLFSNSYG 
GMVTHYGGAA GPVIFGVGYN DIKSWWLVGA VLTILTFLVH ITLGVWWWNM LIGWNML