Gene Emin_1123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1123
Symbol
ID	6263473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1223995
End bp	1225116
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	40%
IMG OID	642611603
Product	von Willebrand factor type A
Protein accession	YP_001876012
Protein GI	187251530
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1240] Mg-chelatase subunit ChlD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	84
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATAT TTTTAAAAAT ACTTATAGTA TTTATGGTTC TTTTAATCCT TAACCTGCTG 
GCTATGATTG TTGCCAAACA GGGTAAGGCA AAGGACTCTT TATATAAATT TTCTTTTTTA 
CTTTTTGTAG TGACAGTGCT TTTAATGCTT TTAAATATTG TTATTTTTAA ATTTTTTAAA 
GGTACTGTTT TCGCTAGTCC TTATTTGTTA TTTTTGATTT TGCCGATACT GCTGTTTTGG 
CTGGCGTATC CTTTTTTGCA AAAACTATAT GCGCCGGGGT TAAACTATAA TTTGGCTTAT 
AAGCCGGAAA CTTCAATACC CGCTTTAACG GCAAAATATT TTTGTTTTAC ATTAATAACG 
CTTGGTCTTA TATTTGCCGT TTTGGCTCTT GCCAAACCGA GGGACGCGCA AAAAACAGTT 
TTACCTCCTA CCGAAGGCGT GGATATTATT TTAGCTATAG ACACTTCAGG CAGTATGGCT 
GCGCAGGATT TTGACCCTAA CAGAATAACG GCGGCCAAAG TAGCCGCGGC CAACTTTATA 
GCCAACCGCT TAAGCGACCG TATAGGTATA GTTGTTTTCG CTTCGGACGC TATGTTGCAA 
AGCCCGCTTA CTTTAGATTA TGAGTCGCTT TTGGACTTTT TGGCCGACGT TCGTATCGGC 
ATGGTCAGGA CGGACGGTAC CGCTATAGGA GACGCTATTG CCGTTTCCTC TGTACATCTG 
GAACGCAGTC CCGCAAGAAG CAAGGTGATA ATTCTTTTAA CGGACGGGGA GTCAAACAGC 
GGCGTAATTT CCCCTCTGGA CGCGGCCAAA ACCGCCGCTT TATACGGCAT AAAAGTTTAT 
ACCATTGCTA CCATAAGTAA AAACAGCCGT GACTCGCTTG ATTTTAAACC CGATGATTTG 
GAACAAATAG CCAAACTTAC GGGCGGCAAA TATTACCGCG CGTATAATGA GGCGGAACTG 
ACAAAAATTT ACGCGGAAAT CGACAGCCTT GAAAAAACGG AATTTAAAAA CAGCGTGCTT 
GTTAATTACC GCGAAAGATA TCTGCCGTTT TTAGCTCTTT CACTTATTTT AATATCGTGC 
GGATTTATAT TTTCCAAAAT TATTTTTATG AGGGTGCCCT AA

Protein sequence

MSIFLKILIV FMVLLILNLL AMIVAKQGKA KDSLYKFSFL LFVVTVLLML LNIVIFKFFK 
GTVFASPYLL FLILPILLFW LAYPFLQKLY APGLNYNLAY KPETSIPALT AKYFCFTLIT 
LGLIFAVLAL AKPRDAQKTV LPPTEGVDII LAIDTSGSMA AQDFDPNRIT AAKVAAANFI 
ANRLSDRIGI VVFASDAMLQ SPLTLDYESL LDFLADVRIG MVRTDGTAIG DAIAVSSVHL 
ERSPARSKVI ILLTDGESNS GVISPLDAAK TAALYGIKVY TIATISKNSR DSLDFKPDDL 
EQIAKLTGGK YYRAYNEAEL TKIYAEIDSL EKTEFKNSVL VNYRERYLPF LALSLILISC 
GFIFSKIIFM RVP