Gene B21_02305 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02305
Symbol	eutH
ID	8116591
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2430580
End bp	2431806
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	55%
IMG OID	644848509
Product	hypothetical protein
Protein accession	YP_003000082
Protein GI	251785778
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3192] Ethanolamine utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAATTA ACGAAATCAT CATGTACATC ATGATGTTCT TTATGCTGAT AGCTGCCGTA 
GACAGGATCC TGTCGCAGTT CGGCGGTTCT GCTCGTTTCC TCGGTAAGTT CGGTAAAAGT 
ATCGAAGGAT CAGGCGGTCA GTTCGAAGAA GGCTTTATGG CAATGGGCGC ACTGGGCCTG 
GCGATGGTCG GTATGACCGC GCTGGCACCG GTACTGGCTC ACGTTCTCGG GCCGGTAATT 
ATTCCGGTTT ACGAAATGCT CGGCGCTAAC CCATCGATGT TCGCCGGAAC ACTGCTGGCG 
TGCGATATGG GCGGCTTCTT CCTCGCCAAA GAGCTGGCGG GCGGCGACGT AGCAGCGTGG 
CTATACTCTG GGTTAATTCT CGGGTCGATG ATGGGGCCAA CGATTGTGTT TTCCATTCCG 
GTGGCGCTCG GCATTATCGA ACCTTCTGAC CGTCGTTATC TGGCGCTCGG CGTGCTGGCG 
GGCATTGTGA CCATTCCGAT TGGCTGTATT GCTGGTGGTC TGGTTGCTAT GTACTCCGGT 
GTGCAGATCA ATGGTCAGCC GGTGGAATTC ACCTTTGCGC TGATCCTGAT GAACATGATC 
CCGGTACTTA TCGTTGCGGT GCTGGTGGCG CTGGGGCTGA AATTCATCCC GGAAAAAATG 
ATCAACGGCT TCCAGATCTT CGCCAAATTC CTCGTTGCAT TGATCACCCT CGGTCTTGCT 
GCCGCGGTAG TGAAATTCCT CCTTGGCTGG GAACTGATCC CCGGTCTGGA CCCTATCTTT 
ATGGCTCCTG GCGATAAACC CGGTGAAGTG ATGCGCGCCA TTGAAGTTAT CGGTTCTATC 
TCCTGCGTGC TGTTAGGGGC GTATCCAATG GTGCTGCTGC TGACTCGCTG GTTTGAAAAA 
CCGCTGATGA GCGTCGGTAA ACTACTGAAT ATGAACAACA TTGCGGCAGC CGGCATGGTG 
GCAACGCTTG CCAACAACAT CCCGATGTTT GGCATGATGA AGCAGATGGA TACCCGCGGC 
AAAGTCATCA ACTGCGCCTT CGCCGTTTCC GCTGCTTTCG CCCTGGGTGA CCACTTAGGC 
TTCGCCGCTG CCAACATGAA CGCCATGATC TTCCCGATGA TTGTCGGCAA GTTGATCGGC 
GGCGTAACGG CGATTGGCGT GGCGATGATG CTGGTGCCAA AAGAAGACGC GACCACGACT 
AAAACCGAAG CGGAGGCACA ATCGTGA

Protein sequence

MGINEIIMYI MMFFMLIAAV DRILSQFGGS ARFLGKFGKS IEGSGGQFEE GFMAMGALGL 
AMVGMTALAP VLAHVLGPVI IPVYEMLGAN PSMFAGTLLA CDMGGFFLAK ELAGGDVAAW 
LYSGLILGSM MGPTIVFSIP VALGIIEPSD RRYLALGVLA GIVTIPIGCI AGGLVAMYSG 
VQINGQPVEF TFALILMNMI PVLIVAVLVA LGLKFIPEKM INGFQIFAKF LVALITLGLA 
AAVVKFLLGW ELIPGLDPIF MAPGDKPGEV MRAIEVIGSI SCVLLGAYPM VLLLTRWFEK 
PLMSVGKLLN MNNIAAAGMV ATLANNIPMF GMMKQMDTRG KVINCAFAVS AAFALGDHLG 
FAAANMNAMI FPMIVGKLIG GVTAIGVAMM LVPKEDATTT KTEAEAQS