Gene Emin_0487 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0487
Symbol
ID	6262729
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	524183
End bp	525367
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	37%
IMG OID	642610957
Product	glycosyl transferase group 1
Protein accession	YP_001875380
Protein GI	187250898
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000304875
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAATA GAGATAACAG AGTAAAAATT TTATATATAA TTACGCGTTT GGACGCCGGC 
GGCGCCCAAA AAAGCGTGTT GTATTCCGCC GCCAATCTGT CTAAAAATAA ATTTAAAGTT 
TTCTTAGCGG CAGGACCGGG CGGAGTGCTG GATCCTTTCG CAAAAAAACT TCTTAAAAAT 
AAATATTTTT ATATCAATAG CCTTAGGCAG CGCGTTTGCT TTTATAACCT TTTTTATGAT 
TTGGTATCTT TATTTCAAAC GGCCTGGCTT ATAATAAAAA TCAGGCCGCA TATAATTCAT 
ACAAACTGTC CTAAGGCGGG TGTAGTAGGG CGAGCGGCGG CTTTTTTAAC CGCTCCTAAA 
ACAAAGGTTA TACACACTTA TCATGGCTTA GGTTTTAGCG TCTATGGCGG TATAAAAAGA 
TATTTATTTT ATTCTAAAAT TGAAAAATAT TTTTCTTTTA TAACGGACCA GTTGGTTTTT 
GTATCAAATT CAAATATGCA AGAAGCGCTT ACGCTTGGCA TAGGCAACGT AAAAAAAAAT 
ATTCTTATTT ATCCCGGAGC TGAGTTTGAA AAGTTAAAAC CATCTTTTGA TTATAATGCC 
AAACTTGAAT CGCTGCGTAT TCCTAAAGGG GCAAAGGTCA TATTAAGCAT AGGTAATTTT 
AAACCTTTAA AAAACGCCCG CGATTTTGTG CTTGTGGCTA AACATGTTTT AAAAAAAATT 
CCCGGAGCAT ATTTTCTTTA CGCTGGCTGT GGAGGGATGG AAGAACGCAA AGTAAAAACG 
CTTGCTAAAA AATCAGGACT TAAAAATCAT TTGTTTTTTT TAGGAATGCG GCATGATACC 
CGTGAATTGT TGGCTGTAAG CGATTTGTAT GTTTCAACTT CTCTGCGTGA AGGCATGCCT 
GTTGCTTTGC TTGAAGCTTT GGGCGCGGGC GTGCCGGCTG TTTGTTATGA GGCTGACGGC 
ACCGCCGAGG TTTTGATAAA CGGCAAAAAC GGTTTTATTT TAGGCCAGCG AAACAAAGAA 
GGAATGTCAG ATAAAATAAT TGAGATTTTA AAAAACGATA AAATTTATTT CACTATCAAA 
CAAGGCGTAA AAAGTTTTGA TAAAAATCTT TTTAGCGCGG TTTCCACCGT CAGAAAGCAA 
GAAGAATTGT ATAATAAAAT ACTGCTTAAA AACCCGGGTT CTTAA

Protein sequence

MKNRDNRVKI LYIITRLDAG GAQKSVLYSA ANLSKNKFKV FLAAGPGGVL DPFAKKLLKN 
KYFYINSLRQ RVCFYNLFYD LVSLFQTAWL IIKIRPHIIH TNCPKAGVVG RAAAFLTAPK 
TKVIHTYHGL GFSVYGGIKR YLFYSKIEKY FSFITDQLVF VSNSNMQEAL TLGIGNVKKN 
ILIYPGAEFE KLKPSFDYNA KLESLRIPKG AKVILSIGNF KPLKNARDFV LVAKHVLKKI 
PGAYFLYAGC GGMEERKVKT LAKKSGLKNH LFFLGMRHDT RELLAVSDLY VSTSLREGMP 
VALLEALGAG VPAVCYEADG TAEVLINGKN GFILGQRNKE GMSDKIIEIL KNDKIYFTIK 
QGVKSFDKNL FSAVSTVRKQ EELYNKILLK NPGS