Gene ECD_02978 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_02978
Symbol	yhaO
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	3122977
End bp	3124245
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	50%
IMG OID
Product	predicted transporter
Protein accession	ACT44782
Protein GI	253979112
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGAGA GCGAGTGGCG AGAAGCGATC AAATTCGACA GTACTGACAC CGGCTGGGTG 
ATTATGAGTA TCGGGATGGC GATTGGCGCG GGGATTGTTT TTCTCCCGGT GCAGGTCGGT 
TTGATGGGAT TGTGGGTATT TTTGCTCTCA TCGGTGATTG GTTACCCGGC AATGTATCTG 
TTTCAGCGGT TGTTTATTAA TACGCTGGCA GAATCACCAG AATGTAAAGA TTACCCGAGT 
GTCATTAGCG GTTATTTAGG TAAAAACTGG GGCATCCTGT TAGGTGCGCT CTATTTCGTA 
ATGCTGGTGA TTTGGATGTT CGTCTATTCC ACCGCCATCA CCAACGATAG TGCTTCCTAC 
CTGCATACCT TCGGCGTGAC GGAAGGGTTG CTGTCAGACA GTCCCTTTTA TGGTCTGGTA 
CTGATTTGCA TTCTGGTGGC GATCTCCTCA CGCGGCGAGA AATTGTTATT CAAAATTTCG 
ACCGGCATGG TGCTGACCAA GCTGCTGGTG GTCGCGGCGC TGGGCGTGTC GATGGTGGGA 
ATGTGGCATC TGTATAACGT CGGTTCGCTA CCGCCGCTGG GGCTGCTGGT GAAAAACGCC 
ATTATTACGC TGCCGTTTAC CCTGACGTCG ATTCTGTTTA TTCAGACGTT AAGCCCGATG 
GTGATCTCTT ATCGCTCGCG GGAAAAATCC ATTGAAGTGG CGCGGCATAA AGCATTGCGG 
GCAATGAATA TCGCGTTTGG CATTTTGTTT GTCACCGTCT TTTTCTACGC CGTGTCGTTC 
ACGCTGGCGA TGGGACATGA CGAAGCGGTA AAAGCCTACG AGCAGAATAT TTCCGCGCTG 
GCGATTGCCG CACAGTTTAT TAGCGGTGAC GGCGCAGCGT GGGTGAAAGT GGTCAGCGTC 
ATTCTCAATA TCTTTGCTGT CATGACTGCA TTCTTTGGCG TCTATTTAGG CTTTCGCGAA 
GCAACGCAAG GGATCGTAAT GAACATCCTG CGTCGCAAGA TGCCTGCCGA GAAGATTAAC 
GAAAATCTTG TTCAGCGCGG CATCATGATT TTCGCCATTT TGCTGGCCTG GAGCGCCATC 
GTACTGAACG CACCGGTGTT GAGCTTCACC TCTATCTGTA GCCCGATTTT CGGCATGGTA 
GGGTGCCTGA TCCCGGCGTG GCTGGTTTAC AAAGTACCGG CATTGCACAA ATACAAAGGG 
ATGTCTCTGT ACCTGATTAT CGTCACTGGT TTGTTGCTTT GTGTTTCTCC GTTCCTGGCA 
TTTTCTTGA

Protein sequence

MSESEWREAI KFDSTDTGWV IMSIGMAIGA GIVFLPVQVG LMGLWVFLLS SVIGYPAMYL 
FQRLFINTLA ESPECKDYPS VISGYLGKNW GILLGALYFV MLVIWMFVYS TAITNDSASY 
LHTFGVTEGL LSDSPFYGLV LICILVAISS RGEKLLFKIS TGMVLTKLLV VAALGVSMVG 
MWHLYNVGSL PPLGLLVKNA IITLPFTLTS ILFIQTLSPM VISYRSREKS IEVARHKALR 
AMNIAFGILF VTVFFYAVSF TLAMGHDEAV KAYEQNISAL AIAAQFISGD GAAWVKVVSV 
ILNIFAVMTA FFGVYLGFRE ATQGIVMNIL RRKMPAEKIN ENLVQRGIMI FAILLAWSAI 
VLNAPVLSFT SICSPIFGMV GCLIPAWLVY KVPALHKYKG MSLYLIIVTG LLLCVSPFLA 
FS