Gene B21_02644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02644
Symbol	ygeD
ID	8115194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2810158
End bp	2811351
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	56%
IMG OID	644848841
Product	hypothetical protein
Protein accession	YP_003000414
Protein GI	251786110
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0181673
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGAGT CAGTGCACAC TAACACTTCG TTGTGGTCGA AGGGGATGAA AGCGGTTATC 
GTGGCGCAGT TTCTCTCTGC GTTTGGCGAT AATGCCCTAC TGTTTGCCAC TCTGGCGTTA 
CTGAAAGCGC AGTTCTATCC GGAGTGGAGC CAGCCCATCC TGCAAATGGT GTTTGTAGGT 
GCTTACATTC TTTTTGCGCC GTTTGTCGGG CAGGTGGCGG ATAGCTTCGC CAAAGGCCGG 
GTGATGATGT TTGCCAACGG CCTGAAGCTG CTGGGCGCAG CCAGTATCTG CTTTGGTATC 
AATCCGTTTC TCGGCTATAC GCTGGTGGGT GTTGGTGCTG CAGCCTATTC ACCGGCGAAA 
TACGGTATTC TCGGCGAATT AACCACGGGT AGTAAGTTAG TGAAAGCTAA CGGTTTAATG 
GAAGCTTCTA CCATAGCGGC GATTTTGCTC GGTTCCGTAG CCGGTGGTGT GCTGGCTGAC 
TGGCATGTCC TCGTCGCCCT GGCCGCATGC GCACTGGCCT ACGGTGGTGC GGTCGTTGCC 
AATATCTACA TTCCCAAACT GGCGGCGGCG CGTCCGGGGC AGTCCTGGAA TCTCATCAAC 
ATGACCCGCA GTTTCCTGAA TGCCTGCACC TCGCTATGGC GCAATGGTGA AACGCGTTTT 
TCGCTGGTGG GCACCAGTTT ATTCTGGGGA GCGGGTGTCA CGCTGCGTTT CCTGTTGGTG 
CTGTGGGTAC CGGTGGCGCT GGGCATTACC GATAACGCTA CGCCCACCTA TCTCAACGCG 
ATGGTAGCGA TTGGTATCGT GGTTGGCGCA GGTGCGGCAG CGAAGTTAGT TACGCTGGAA 
ACCGTGTCAC GCTGTATGCC AGCCGGGATT TTGATTGGCG TGGTGGTACT GATTTTTTCC 
CTGCAACACG AGCTGCTGCC AGCCTATGCC TTGTTGATGC TGATTGGCGT GATGGGGGGC 
TTTTTTGTCG TTCCGCTCAA TGCGTTGCTA CAGGAGCGGG GTAAAAAAAG CGTCGGGGCG 
GGGAATGCGA TTGCAGTACA AAACCTTGGC GAAAACAGCG CCATGTTGTT GATGCTGGGC 
ATTTACTCGC TGGCGGTAAT GATAGGCATC CCGGTCGTGC CCATTGGCAT TGGCTTCGGT 
GCGCTGTTTG CGCTGGCAAT AACGGCGCTG TGGATCTGGC AGCGCCGTCA TTAA

Protein sequence

MSESVHTNTS LWSKGMKAVI VAQFLSAFGD NALLFATLAL LKAQFYPEWS QPILQMVFVG 
AYILFAPFVG QVADSFAKGR VMMFANGLKL LGAASICFGI NPFLGYTLVG VGAAAYSPAK 
YGILGELTTG SKLVKANGLM EASTIAAILL GSVAGGVLAD WHVLVALAAC ALAYGGAVVA 
NIYIPKLAAA RPGQSWNLIN MTRSFLNACT SLWRNGETRF SLVGTSLFWG AGVTLRFLLV 
LWVPVALGIT DNATPTYLNA MVAIGIVVGA GAAAKLVTLE TVSRCMPAGI LIGVVVLIFS 
LQHELLPAYA LLMLIGVMGG FFVVPLNALL QERGKKSVGA GNAIAVQNLG ENSAMLLMLG 
IYSLAVMIGI PVVPIGIGFG ALFALAITAL WIWQRRH