Gene ECD_03337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_03337
Symbol	yhiI
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	3491919
End bp	3492986
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	58%
IMG OID
Product	predicted HlyD family secretion protein
Protein accession	ACT45138
Protein GI	253979468
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAAGA GTAAGCGCCA TCTGGCGTGG TGGGTTGTCG GCTTACTGGC GGTGGCGGCT 
ATCGTGGCGT GGTGGCTGTT GCGCCCGGCA GGTGTGCCGG AAGGCTTTGC TGTCAGTAAT 
GGGCGCATTG AAGCGACGGA AGTGGATATT GCCAGCAAAA TTGCCGGGCG TATCGACACC 
ATTCTGGTGA AAGAAGGCCA GTTTGTTCGC GAAGGTGAAG TGCTGGCGAA GATGGATACT 
CGCGTGTTGC AGGAACAGCG ACTGGAAGCC ATCGCGCAAA TCAAAGAGGC ACAAAGCGCC 
GTTGCTGCCG CGCAGGCTTT GCTGGAGCAA CGACAAAGCG AAACTCGTGC CGCACAGTCG 
CTGGTTAATC AACGCCAGGC AGAACTGGAC TCCGTAGCAA AACGTCATAC GCGTTCCCGT 
TCACTGGCCC AACGAGGGGC TATTTCTGCG CAACAGCTGG ATGACGATCG CGCCGCCGCT 
GAGAGCGCCC GAGCTGCGCT GGAATCGGCG AAAGCTCAGG TATCGGCTTC TAAAGCGGCT 
ATAGAAGCGG CACGCACCAA TATCATTCAG GCGCAAACCC GCGTCGAAGC GGCACAAGCC 
ACTGAACGGC GCATTGCCGC AGATATCGAT GACAGCGAAC TGAAAGCCCC GCGTGACGGA 
CGCGTGCAGT ATCGGGTTGC CGAGCCAGGC GAAGTGCTGG CGGCAGGCGG TCGGGTGCTG 
AATATGGTCG ATCTCAGCGA CGTCTATATG ACTTTCTTCC TGCCAACCGA ACAGGCGGGC 
ACGCTGAAAC TGGGCGGTGA AGCCCGGCTG ATCCTCGATG CCGCGCCAGA TCTGCGTATT 
CCTGCAACCA TCAGTTTTGT CGCCAGTGTC GCCCAGTTCA CGCCAAAAAC CGTCGAAACC 
AGCGATGAAC GGCTGAAACT GATGTTCCGC GTCAAAGCGC GTATCCCACC GGAATTACTC 
CAGCAGCATC TGGAATATGT CAAAACCGGT TTGCCGGGCG TAGCGTGGGT GCGGGTGAAT 
GAAGAACTTC CGTGGCCTGA CGACCTCGTG GTGAGGTTGC CGCAATGA

Protein sequence

MDKSKRHLAW WVVGLLAVAA IVAWWLLRPA GVPEGFAVSN GRIEATEVDI ASKIAGRIDT 
ILVKEGQFVR EGEVLAKMDT RVLQEQRLEA IAQIKEAQSA VAAAQALLEQ RQSETRAAQS 
LVNQRQAELD SVAKRHTRSR SLAQRGAISA QQLDDDRAAA ESARAALESA KAQVSASKAA 
IEAARTNIIQ AQTRVEAAQA TERRIAADID DSELKAPRDG RVQYRVAEPG EVLAAGGRVL 
NMVDLSDVYM TFFLPTEQAG TLKLGGEARL ILDAAPDLRI PATISFVASV AQFTPKTVET 
SDERLKLMFR VKARIPPELL QQHLEYVKTG LPGVAWVRVN EELPWPDDLV VRLPQ