Gene Emin_0359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0359
Symbol
ID	6263121
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	384862
End bp	386208
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	41%
IMG OID	642610824
Product	NHL repeat-containing protein
Protein accession	YP_001875254
Protein GI	187250772
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.570534
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGGGA CTTATAAAAA AATTTTACAC TCTTTAGGAA TGATTATTTT TATCGGCGCT 
TTTATATGCG TTTCTTTATA CGGCATTAAA GCGGGCGCAA ATTTTGGGAC AAAATTCCAA 
AAGCAAAAGA TGGCAGATTC TTACGAAGTT GAAGTAAAGG AAACAGAAAG AGCTGTCTCA 
CAAATTTCCA ACCCTACCCA AAACTTGGAA CCTGACACAA AAGAGACTGC TAAACAAAAC 
ATTCCCGCGA CAAAAACCGT ACAACCTCAG GCTGATAACC CCATAAATGA CGCTTTTGTT 
CCCCCGGCAA AAACGCTTTC AATGCAGTTA ATAAAAAGAA CCGGTATAGT AAGGCCTGTC 
GCTGGCAAAG GCATAGCGGG TTTTAACGGT GACGACCAAC TTGGCGCTTT GCAAAGTTCA 
CTTTCAAACC CTTGCGCAAT AGCGGTTGAT AATTTAAGCG CTTTATATAT ATTAGATAAA 
GGAAATAAAC GAATAAGAAA GGTTTTTGCC GACGGTATGA TTACCACTTT AGCGGGCAAC 
GGGCGCAGCG GCATGTTTCA GGAAGGACTT GTGGCGGAGG ACTTTAGATT TTCAGATTTG 
CAAGATATAG CATTATCTCC AGAAGGAACA ATTTATATAA TTGACAGCGG TTTTAAACGC 
CTTTTAAAAA TGGATGACAA CCGCATTATA AGCACAGTGG CGGGCGGAGG CAGAACTCCT 
GCGCAAAACG GCGGCGCTGG CGTTACGACA CAACTTTCTT TACCCACGGC CGTGGCTACT 
GACCGGCAGG GAAACATCTT TATAGCGGAC GGCACCGTAA TACTTAAAAT AAATAACAGA 
GGCCGCGTAA ATATTGAGCT TGATTTAAGC AAAGTTTCTT TTATCGACAG TGACATGAAA 
AATAAAGATT TAACAAAAGC CCAAATATCC TCCCTAGCGG TTAACCGAAG CGGTGATGTC 
TTTATATCAG ACAGCTATAA TAACTGTGTG TATAAACTTA ACGCAAATAA TACTTTGGAA 
AATTTTGCCG GCTGCGGGCC TAAACATATT CATTTAAAAG AACCCCACGG CCTTACGGTA 
GACGCGGCCG ATATAGTTTA TTTGGCGGAT TCAGGTAACA ACAGGGTAAT TAAGTTCGCT 
CCTTCCGGAA CTCCCGTAAT AATAGCGGAC AACGATTTTG ACGACGTTAA CGGCGTAATA 
AAATCAAACA ACGCTGGGTT GAATTATCCT ACCGGAGTGG CGGTTAACAA CAGGGGCGAG 
GTTTATATAG CCGATTCAAG AAACAATGTT GTAAGTAAAA TTTTCTTCGG CCTAAATAAT 
GAAGAAATTG CTGGTATTAC TCAGTAA

Protein sequence

MKGTYKKILH SLGMIIFIGA FICVSLYGIK AGANFGTKFQ KQKMADSYEV EVKETERAVS 
QISNPTQNLE PDTKETAKQN IPATKTVQPQ ADNPINDAFV PPAKTLSMQL IKRTGIVRPV 
AGKGIAGFNG DDQLGALQSS LSNPCAIAVD NLSALYILDK GNKRIRKVFA DGMITTLAGN 
GRSGMFQEGL VAEDFRFSDL QDIALSPEGT IYIIDSGFKR LLKMDDNRII STVAGGGRTP 
AQNGGAGVTT QLSLPTAVAT DRQGNIFIAD GTVILKINNR GRVNIELDLS KVSFIDSDMK 
NKDLTKAQIS SLAVNRSGDV FISDSYNNCV YKLNANNTLE NFAGCGPKHI HLKEPHGLTV 
DAADIVYLAD SGNNRVIKFA PSGTPVIIAD NDFDDVNGVI KSNNAGLNYP TGVAVNNRGE 
VYIADSRNNV VSKIFFGLNN EEIAGITQ