Gene EcDH1_3735 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3735
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	4025405
End bp	4026487
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	54%
IMG OID
Product	permease YjgP/YjgQ family protein
Protein accession	ACX41340
Protein GI	260450918
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.00436584
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACCTT TTGGCGTACT TGACCGCTAT ATCGGTAAAA CTATTTTCAC CACCATCATG 
ATGACACTGT TCATGCTGGT GTCGCTGTCG GGCATTATCA AGTTTGTCGA TCAGCTGAAA 
AAAGCCGGGC AGGGGAGTTA CGACGCGTTA GGCGCAGGAA TGTATACCTT GCTGAGCGTG 
CCGAAAGATG TGCAGATCTT CTTCCCGATG GCGGCTCTGC TTGGGGCGTT GCTTGGTCTT 
GGGATGCTGG CGCAGCGCAG CGAACTGGTG GTGATGCAGG CTTCTGGTTT TACCCGTATG 
CAGGTGGCGC TGTCGGTGAT GAAAACCGCC ATTCCGCTGG TCTTGCTGAC GATGGCGATT 
GGCGAATGGG TCGCGCCGCA GGGCGAGCAG ATGGCGCGTA ACTACCGTGC GCAGGCGATG 
TACGGCGGCT CGTTGCTCTC TACCCAGCAA GGCTTATGGG CGAAAGATGG CAACAACTTC 
GTCTACATTG AGCGGGTTAA AGGTGACGAA GAGTTAGGTG GCATCAGCAT TTATGCCTTT 
AACGAGAATC GTCGTCTGCA ATCCGTACGC TATGCCGCTA CTGCGAAGTT TGACCCGGAA 
CATAAAGTCT GGCGTCTGTC GCAGGTTGAT GAATCTGATC TGACCAATCC GAAACAGATT 
ACCGGTTCGC AGACGGTGAG CGGCACCTGG AAAACCAACC TCACGCCGGA CAAACTGGGC 
GTGGTGGCGC TGGACCCGGA TGCACTCTCT ATCAGCGGTT TGCACAACTA TGTGAAGTAT 
CTGAAGTCGA GCGGTCAGGA TGCCGGACGT TATCAGCTCA ACATGTGGAG CAAAATCTTC 
CAGCCGCTAT CTGTGGCGGT GATGATGCTG ATGGCGCTGT CGTTCATCTT TGGCCCACTG 
CGTAGCGTAC CGATGGGCGT GCGTGTGGTC ACCGGTATCA GTTTCGGTTT TGTCTTCTAC 
GTACTGGACC AGATCTTCGG CCCGCTGACG TTGGTTTATG GCATCCCGCC GATCATCGGC 
GCACTGTTGC CAAGCGCCAG CTTCTTCTTA ATCAGCCTGT GGCTGTTAAT GAGAAAATCG 
TAA

Protein sequence

MQPFGVLDRY IGKTIFTTIM MTLFMLVSLS GIIKFVDQLK KAGQGSYDAL GAGMYTLLSV 
PKDVQIFFPM AALLGALLGL GMLAQRSELV VMQASGFTRM QVALSVMKTA IPLVLLTMAI 
GEWVAPQGEQ MARNYRAQAM YGGSLLSTQQ GLWAKDGNNF VYIERVKGDE ELGGISIYAF 
NENRRLQSVR YAATAKFDPE HKVWRLSQVD ESDLTNPKQI TGSQTVSGTW KTNLTPDKLG 
VVALDPDALS ISGLHNYVKY LKSSGQDAGR YQLNMWSKIF QPLSVAVMML MALSFIFGPL 
RSVPMGVRVV TGISFGFVFY VLDQIFGPLT LVYGIPPIIG ALLPSASFFL ISLWLLMRKS