Gene Emin_0644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0644
Symbol
ID	6263174
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	711520
End bp	712623
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	50%
IMG OID	642611115
Product	hypothetical protein
Protein accession	YP_001875536
Protein GI	187251054
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000239983
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCTTA TAATTAAAAA AGGGTCTAAT TTTAAAAATA TGGACAAGAA AAAAGCCTAT 
ACTTGGGGGG CTTGTGCTTT GGTTTTTTTG CTTGTTCTTT TTACTTTAAT CGGCGCTATG 
GCCGGTAGTG ATGAAGGCAA GCCCGACGAT TTTAGCAACC TTTCTTCCCG AAATTTCGAC 
TTAGCGCAGC TTCCGTTTGT AAACGATGAG GCTGAAAAAG AATTGCTTGC GAAATATAAT 
GATATCAGCG GTGTTCCGGA CAGCACTCTT TTTACCCCGG AAGAAAAGGA AGCCCGCCAG 
GAGGCGGACG CTTTATCTGA AGAGGAAGCC CCCGACGCGG AGTATGAGGC CGCTTTAAAG 
GAGTTATCCG CGCGTAATAC CCCTGCGCCC GCACCTGCTT CGTCTGCTTA TAGCAGTTAC 
GGTTCCGGCG TAAGCAAACC TGCTACACAA ATAGGCACAA TGAGTAAAGG TTCAATGGTC 
AGCGGAGGGG GAGGCGGTTT AAGGGGCACA AGCTGGACGC CCGGTAATGC TTCTGCGTCT 
AATGCGAAAA CGGCTAACAC AAAGGTAAGC AAAGAAATGC TTGCCAAGCT CAGCAAAACG 
GAAAGGGGCC GAAGTTTATT ACAGGCTTAC GCGGAATCTT CAGCAGGCGC TAAAAAAGAC 
GGTGAGGGCG CCTTATCCGG GGCTATGGCT GCTTTTCAGG GCGGTAAAGC CACAGCGGAA 
CTTGATACGG ATTTAGAAAC GGCTATGGCG GAGCTTGCGC TTGATGAAAC CGCCGGGATT 
GGGGGCCAAG CTGCCAGTGA AGGGCCTTCA ATAGGTGATG TCGCCAAGGC TGTTAAAGAT 
GGGCAGGAAA AGAAAGACAG GCAAATCCCC GAACCTAAAC CGAGTTTTTG GGCTGAGCTT 
GGAAAACAAA TGCTAAAAGG TTTGGTTGAC GGCGCTACCC AAATTGCTAT TGGGCAAGCC 
AACCAGCAAA TATCTATAAA AACATGTGTG AAGGGTTCTA AAGAGTACGG TTTTAACGCG 
GCGGATTGTT TCGCTAAACC GGGAGGAGGA TCGTCCGGAA TTTCAAGCGG GGTCGGAGCT 
TCAAGCGGGG CGGCAGGCTC ATAA

Protein sequence

MALIIKKGSN FKNMDKKKAY TWGACALVFL LVLFTLIGAM AGSDEGKPDD FSNLSSRNFD 
LAQLPFVNDE AEKELLAKYN DISGVPDSTL FTPEEKEARQ EADALSEEEA PDAEYEAALK 
ELSARNTPAP APASSAYSSY GSGVSKPATQ IGTMSKGSMV SGGGGGLRGT SWTPGNASAS 
NAKTANTKVS KEMLAKLSKT ERGRSLLQAY AESSAGAKKD GEGALSGAMA AFQGGKATAE 
LDTDLETAMA ELALDETAGI GGQAASEGPS IGDVAKAVKD GQEKKDRQIP EPKPSFWAEL 
GKQMLKGLVD GATQIAIGQA NQQISIKTCV KGSKEYGFNA ADCFAKPGGG SSGISSGVGA 
SSGAAGS