Gene Emin_1307 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1307
Symbol
ID	6263995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	1408855
End bp	1409862
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	38%
IMG OID	642611786
Product	glycosyl transferase family protein
Protein accession	YP_001876194
Protein GI	187251712
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	81
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAAAAG TAAGTATTAT AATACCTGTT TATAACTTAG AAAATTATCT TCCACAATGC 
CTGCAATCGG TAGAACAGCA GACTTTGGAA GATATAGAAG CGCTTGTGGT TGATAACGCC 
AGCACGGACA ACAGCGCTGA AATAATAAAA CAATTTGCCG CTTTAAACTC CAAAATAAGA 
ATTTTACACT GTAAAACAAA AGGCGCCGCT AACGCCAGAA ACTGCGCCCT TAAAGAAGCC 
TCCGGTGAAT ACTTATTCTT TTTAGACGGA GACGATTGGC TTACCCCGCA ATGTCTTGCC 
GCTTTATATA AAGAAGCTAA AGCAAATGAC GCAGATGTTA CTGTTTGCGA CAACGCCCTT 
TATACAGAAA CAACCAATTT AATGTCTTTC CCGCAGGAAA ATATGTTTTT TTCAGCCCCT 
AAGCTTGAAA CTTTAAAAGA AAAAAGCCTT CTGTTAAAAG CCCCGTTTAC AGCATATTCC 
TGCGCGGGCA AACTTATAAG AAGAAGCTTT TTTGAGAAAA ATAGCCTGTC TTTCCCTTCA 
GAAATGCCCC GGGGCGACGA CTGGCCCGTT TCCATGAAAA TCACCGTGCT TGCCAACAGA 
ATAAAACTTG TGCCCAATGA ATACTATTTT TACAGAGTTG GCAGACAAAA CGCCGAAAGC 
GCAAATCTGA GCGCTTTTAA CTCTTACATT TACGCTTCCA GGCTGAATTA TAAATTTTTA 
AAAGAAGCGG ACGCCTACGA AACTTTTGCC CCGCAGTTTG AATATTTAAG AATGTATTAC 
ATTTTGTCTT TTATGGCTTT GCATAAACTT GATAAAGAGC AAAAAGCCGC GCTTTTAACA 
CTTCGTAAAG ATATTTTATC AATACCGCTT TCGGTGTTTG AAGGGCGCGA ACTTAAATTT 
AAACTGTCTT TTTTAGGTTT AAAAATTTGT ATATTATGTA AAATCACTTT ATACGCGGAT 
ATGATAAATT TTATATATGC GCGTTTAAAA GGTAAAAAAA TATCATAA

Protein sequence

MPKVSIIIPV YNLENYLPQC LQSVEQQTLE DIEALVVDNA STDNSAEIIK QFAALNSKIR 
ILHCKTKGAA NARNCALKEA SGEYLFFLDG DDWLTPQCLA ALYKEAKAND ADVTVCDNAL 
YTETTNLMSF PQENMFFSAP KLETLKEKSL LLKAPFTAYS CAGKLIRRSF FEKNSLSFPS 
EMPRGDDWPV SMKITVLANR IKLVPNEYYF YRVGRQNAES ANLSAFNSYI YASRLNYKFL 
KEADAYETFA PQFEYLRMYY ILSFMALHKL DKEQKAALLT LRKDILSIPL SVFEGRELKF 
KLSFLGLKIC ILCKITLYAD MINFIYARLK GKKIS