Gene Emin_1550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1550
Symbol
ID	6263483
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1641631
End bp	1642827
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	38%
IMG OID	642612038
Product	glycosyl transferase group 1
Protein accession	YP_001876433
Protein GI	187251951
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.267317
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0000000000000568319
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAATAG ATAATTATTC TCACTTAGTT TCACCGGGCG AAATAGAATA TATTAAAAAA 
ACAGGAATGA CTCTCAAGGG TAAAACCGCC AATATAGTTA CTACGGCCGC ATACGGAAGC 
GGCGTATCTG AGCTTGTGGG GAACGTGCTT CCGTTTTTCC AGGATTTTGA CATTGAGACT 
AAAAGAATAA ATTTAAATAT GCCAAAAGAT TTTTTGGATA TTTCCAAAAA ATTTTATGAA 
GGGCTTAGCA ACTCTTTGGT AAACATAACA CAAGAGGACC TTGATTTCTT TTTAAGTTTT 
AAACCGCTTA TAAGAGAGCA GACCTCAAAC CCGTGCGATT TGCTTTATGC TAATGATCAC 
GCCGCGCTTA CGGCTATTGA TAACAAGGTT TTTAAAAAGG CGATATGGCG TTGCCATATA 
GACGTTTCTC ATTCAAATCC ATTTTTATGG CATTTTCTTA AAAGATATAT TGAAAAGTTT 
GACGTGTCTG CTTTTTCTTT CCCAAGTTTT TCGGGTAATC TTTCAATACC TAAATTTTCA 
ATTATGCCGG CTATAGACCC GCTTTCCGAT AAAAATAAAG AAATTCCCGA AGAGTATATA 
AACAGCGTTT TTGAAAAATA TAATATACCC AGAAGCAAAC CTATCCTTTT GCAAATAGGC 
CGTTATGATG TGTTAAAAGA CCCGCTTGGA GTTATTGAAG TATACCAGGA AGTGGCTAAA 
GAATATAATT GTATTTTAGT GCTTGCCGGG GGCGAGGCGT CGGACGACCC TGCTTCACAT 
TCGGTTTATA AGCAGGTTTT GGAAAAAGCC CAAGAAGTAC CCGGCGTTCA TGTTCTTCTC 
TTAGACCAAA ACGATTTAGA AATTAACGCT TTACAAAGAG GCTCTACCAT AGTTATCCAA 
AAAAGCATAA GAGAAAGTTT TGGTCTTGCC ATAACGGAAG CGTTGTGGAA GAAAAAGCCC 
GTAGTAGCTT CCGAAACCGG AGGCATACCT TTACAGATAA TAGAAGGACT TACGGGTTTG 
TTTTCCGTAA GCAATGTTAC CTGCGTGCAG CAGATAAAAC GTTTATTAAA AAACCCAAAG 
CTCGGTGAAG ATCTTGGACT GGGCGGCTAT GAACACGTAA AAGAGAACTT TTTGATAACA 
AGGCATGTAA GGGATTTAAT GCTTATGTTC TCAAGAGTTT TGGAAACGGA AGTATAA

Protein sequence

MKIDNYSHLV SPGEIEYIKK TGMTLKGKTA NIVTTAAYGS GVSELVGNVL PFFQDFDIET 
KRINLNMPKD FLDISKKFYE GLSNSLVNIT QEDLDFFLSF KPLIREQTSN PCDLLYANDH 
AALTAIDNKV FKKAIWRCHI DVSHSNPFLW HFLKRYIEKF DVSAFSFPSF SGNLSIPKFS 
IMPAIDPLSD KNKEIPEEYI NSVFEKYNIP RSKPILLQIG RYDVLKDPLG VIEVYQEVAK 
EYNCILVLAG GEASDDPASH SVYKQVLEKA QEVPGVHVLL LDQNDLEINA LQRGSTIVIQ 
KSIRESFGLA ITEALWKKKP VVASETGGIP LQIIEGLTGL FSVSNVTCVQ QIKRLLKNPK 
LGEDLGLGGY EHVKENFLIT RHVRDLMLMF SRVLETEV