Gene EcDH1_0322 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0322
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	363061
End bp	364299
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	54%
IMG OID
Product	type IV pilus secretin PilQ
Protein accession	ACX38012
Protein GI	260447590
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.000212409
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCAAT GGATAGCCGC ACTACTGTTG ATGCTGATAC CCGGCGTACA GGCGGCAAAG 
CCGCAAAAAG TGACGCTGAT GGTGGATGAC GTTCCGGTAG CTCAGGTGTT GCAGGCGCTG 
GCTGAACAGG AGAAGTTGAA CCTGGTCGTG TCGCCAGACG TCAGCGGTAC GGTGTCGTTA 
CATCTAACAG ATGTTCCCTG GAAGCAGGCA CTACAAACTG TAGTGAAAAG CGCCGGACTG 
ATAACGCGGC AGGAAGGCAA CATTCTCTCA GTGCATTCCA TTGCCTGGCA GAATAACAAT 
ATCGCCCGCC AGGAGGCGGA GCAGGCGCGG GCGCAGGCAA ATCTGCCGCT GGAAAATCGC 
AGTATAACCC TGCAATACGC CGACGCGGGA GAACTGGCGA AAGCGGGGGA GAAGCTACTG 
AGTGCCAAAG GGAGTATGAC CGTCGATAAA CGCACCAATC GCCTTTTGCT ACGAGATAAC 
AAAACGGCGT TAAGCGCGCT TGAACAGTGG GTAGCGCAAA TGGATCTGCC GGTCGGGCAG 
GTTGAGCTGT CGGCGCATAT TGTCACCATT AATGAAAAAA GTTTGCGTGA GTTAGGCGTG 
AAATGGACGC TGGCCGATGC GCAACACGCT GGTGGCGTTG GGCAAGTCAC CACGCTTGGT 
AGCGACCTCT CCGTAGCGAC GGCGACAACG CATGTCGGTT TTAACATTGG GCGCATCAAC 
GGACGCTTGC TGGATCTTGA GCTTTCCGCG CTCGAACAAA AACAGCAGCT GGATATTATC 
GCCAGTCCGC GTCTGCTGGC CTCACATCTT CAGCCTGCCA GCATTAAACA GGGGAGCGAA 
ATTCCATATC AGGTTTCCAG CGGGGAAAGT GGCGCGACGT CGGTGGAATT TAAAGAGGCC 
GTCCTGGGGA TGGAGGTCAC GCCCACGGTG TTACAAAAAG GTCGCATCCG GCTGAAATTA 
CACATCAGCC AGAACGTTCC GGGGCAGGTG CTACAGCAGG CCGATGGCGA AGTGCTGGCG 
ATTGATAAGC AGGAGATCGA AACGCAGGTC GAGGTCAAAA GCGGAGAAAC GTTGGCGCTG 
GGCGGCATTT TTACCCGTAA AAATAAATCG GGTCAGGATA GCGTACCGTT GCTTGGCGAC 
ATTCCCTGGT TCGGGCAATT ATTTCGTCAT GACGGAAAAG AAGATGAACG ACGCGAGTTA 
GTGGTGTTTA TCACGCCACG ACTGGTTTCC AGTGAGTAA

Protein sequence

MKQWIAALLL MLIPGVQAAK PQKVTLMVDD VPVAQVLQAL AEQEKLNLVV SPDVSGTVSL 
HLTDVPWKQA LQTVVKSAGL ITRQEGNILS VHSIAWQNNN IARQEAEQAR AQANLPLENR 
SITLQYADAG ELAKAGEKLL SAKGSMTVDK RTNRLLLRDN KTALSALEQW VAQMDLPVGQ 
VELSAHIVTI NEKSLRELGV KWTLADAQHA GGVGQVTTLG SDLSVATATT HVGFNIGRIN 
GRLLDLELSA LEQKQQLDII ASPRLLASHL QPASIKQGSE IPYQVSSGES GATSVEFKEA 
VLGMEVTPTV LQKGRIRLKL HISQNVPGQV LQQADGEVLA IDKQEIETQV EVKSGETLAL 
GGIFTRKNKS GQDSVPLLGD IPWFGQLFRH DGKEDERREL VVFITPRLVS SE