Gene Emin_0547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0547
Symbol
ID	6262750
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	599150
End bp	600358
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	40%
IMG OID	642611018
Product	hypothetical protein
Protein accession	YP_001875439
Protein GI	187250957
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAAT TACTTGGATT ACTTCTGGTC CTTGCTTTAG TAGTACCTGC TAAAGCAGAT 
ATACTTAAAA ACTTAAAATC AACCGGTGAG ATACAAGTCA TCGGCGATTC CGTTAACAGA 
GAATTTATGG GCCCCGGCGG TTCATACAGC AATATTACAC TCAGAGTTCT CTATGGTCTT 
AATTTTGACC TGGCTGAAGA TGTTAAAGCT AACTTAACAA TGGCATACTA CAATATGTGG 
GGCCAAAACA CGGGCAATGG TTTTATGAGT ACATACCATA CAGGCCGCCC GTTTCAGGAT 
TATCTTAACG AAGTTGACCT TATTGAAGCA AATGTCGTTT TAAGCAACCT TTTTGACTGT 
TTGGAAGCCA AGGTAGGCCG CCAGTTTTAT GGTGATGAAG ACAGCGCCAT AATATATTTG 
GGTCCTAATC ACTACAATAC AAGACAGTTG GATTACAGGC AGGCTAAGTC AGTTGACGCG 
GCTGTAATCT CCTACGCGGG TGAAATGGTG TCATGGGGCT TTATCTATTC TAAAGTTAAT 
GAATTAGATA CTGCTGCGAA TTTGGACGCT ACCATTCTCG GTTTAGATGT GAAAGCAAAC 
GTAAATGATA ACTTTAAAGC CCAAGGTTAC TTTTATAATT TCAGAAATGA CGATAGCTCT 
AGCTTTAGCA GTGGTACTAC TGAAAAATAT TTAGGCATTT ACGGCGCGAA AGGCACATTT 
AACGCTGATA TATTCACCTT ATCAGCGGAA TACGCCAGAA ACGTAGGCGG GGAAGATGCT 
TTTGATCATG ATAAAGGCAG CTTACTTAAA ATTGATGCTT CCGTTGATCT CGGCGCGTTT 
ACGCCCAGAG GCACAATCGT TCGTGCTGAA AACTTCAGAT CATACGGTAA CTACAGACCT 
GGTATTATTG TAGGCCAGGA AATTGAAAGC ACTACTACAA TGCCACAGGA TTTATTTTTT 
GAAGATATTT TTGTAGGCAA CTTAGGCGTT GACATGAAAT TCGCGGCTTT AGATAAATTT 
GTATTCTCGA TAGACGGTTT TGCTTTTAAT GACAGAAATA TTAAAGACTC AACCTCCTAT 
GAAGCGAATG CTATGGCGAA ATACAATATG AACCCTAACG TTGAACTTCA TGTAGCTGTA 
GGCGGCTTCC ATGAACATTC AATAGATAAT GTTTATAAAG CGCAAGGCGG CATGCTGATA 
AGATTCTAA

Protein sequence

MKKLLGLLLV LALVVPAKAD ILKNLKSTGE IQVIGDSVNR EFMGPGGSYS NITLRVLYGL 
NFDLAEDVKA NLTMAYYNMW GQNTGNGFMS TYHTGRPFQD YLNEVDLIEA NVVLSNLFDC 
LEAKVGRQFY GDEDSAIIYL GPNHYNTRQL DYRQAKSVDA AVISYAGEMV SWGFIYSKVN 
ELDTAANLDA TILGLDVKAN VNDNFKAQGY FYNFRNDDSS SFSSGTTEKY LGIYGAKGTF 
NADIFTLSAE YARNVGGEDA FDHDKGSLLK IDASVDLGAF TPRGTIVRAE NFRSYGNYRP 
GIIVGQEIES TTTMPQDLFF EDIFVGNLGV DMKFAALDKF VFSIDGFAFN DRNIKDSTSY 
EANAMAKYNM NPNVELHVAV GGFHEHSIDN VYKAQGGMLI RF