Gene Emin_1474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1474
Symbol
ID	6263974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1571464
End bp	1572939
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	36%
IMG OID	642611959
Product	5'-nucleotidase domain-containing protein
Protein accession	YP_001876359
Protein GI	187251877
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0737] 5'-nucleotidase/2',3'-cyclic phosphodiesterase and related esterases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAA TATCTTTGCT TTTAGCTTTT GCTTTAACCG CGTGCTTTGT ATTTTCCAAA 
CAATTAATTA TTTACCATAC CAGCGATACC CATGGATTCT ATTATCCTGA AAGAAATACG 
GAAAACAACA AAATGTGGGG CGGTTTTGCC GCGGCAAGAA ATGTTGTTAA TAAAGAAAAG 
CTTCCTTTTT TATTTTTAGA CAGCGGTGAT TATTGCAATG GTACGGTTGA GGCAAAAAAC 
TCAAAATGCG TAACTTCGGC AGAACTTATG AACGCCATGG GTTACGACGC TACCACAATA 
GGCAACCATG AATTTGATTT TGGCGAGGAT AATTTTTTAA AAGTGCTTCC TTTGTTTAAA 
TTCCCCGTGC TTAACTCAAC AATTACGGAC AGCAGGCTTA AAGGGCAGCT TCCTTACACA 
AAACCTTATA AAATCTTTGA AAGAGCCGGC GTTAAAATAG CCATAATCGG CGTGGGTAAA 
GAGGGTGATA ATAAACACTT TAAATTCGCA AATGTTATAA GCACTGTAAA AAAAGTTGTT 
AAAGAGGTAA AAAAAGAAAA CGCCGATATT ATTATTTTGC TTATACATGA TTCCGCCGGC 
GATGAAAAAC ACCCGCAAAA AGTAAGCAAT AAATTAATTG CGGAAAAAAT ACCTGAAATA 
GATATTGTTT TAGGCGGCCA CGCCCACCAG GAATACCAAA ATATTTTTGT GGGCAACGCT 
ATTTTGGTGG AATCGGGATG CCATTTAAAG AAGATGTCTA AAATCGTTGT TGATATTGAT 
GATGAAACCA ATAAATATAA AACAGCCAAA TCTGAACTTA TACCTTTATA TATAGAAAAA 
ACAGGGCAAG ACGAACAAAT TAAAGAACTT GCCGAAAGTT TGAGAGTTCC GGGTATGGAC 
GTTGTTTTAG GCAACACGGC TGCGTATATA AGCAAAACGC CGGTAAAGGA AGGATGCAAA 
GATTCCCCCA TTAACAATTG GATAGCCGAT GTTATAGCCA AAAACGTTGA AGGAGATTTT 
ATTGTCCATA ACGTGGGCGG CGCCAGAATA GGGCTTGAAA AGGGGCCTGT TACCATGCGC 
GATATTGTTA CTTTATTTCC TTTTGATAAT AAAATAGCCG TTGTTGAAGT TGACGGAAAA 
TTTGTTAAAA ACTTTTTTAT AAACGGCATT AAAAACGGCC GCGCTTTATA TAACTTCCAC 
GGGTTAACCG CAAAGTTTAA ATTAAAAAAT AATAAAGTTA AAAATGTTGA AATTTTTATA 
AACGGCAATC CTTTGCAGGA AAACAAAACT TATAAACTTG TTACTAATGA ATATATCGCC 
AAAGGTAAAA CCGAAGGCTG GATGTTTAAA AAAATTGAAG AGGATAAAAA ACAGTTTATT 
TCGCTTAGCA TTAGAGATAT GCTTATAGCC GATTTAAAAG CGAACTCGCC TTTAAAACCT 
TTAAATGACG AGTGCCGCCT CCAGGTTAAA AATTAA

Protein sequence

MKKISLLLAF ALTACFVFSK QLIIYHTSDT HGFYYPERNT ENNKMWGGFA AARNVVNKEK 
LPFLFLDSGD YCNGTVEAKN SKCVTSAELM NAMGYDATTI GNHEFDFGED NFLKVLPLFK 
FPVLNSTITD SRLKGQLPYT KPYKIFERAG VKIAIIGVGK EGDNKHFKFA NVISTVKKVV 
KEVKKENADI IILLIHDSAG DEKHPQKVSN KLIAEKIPEI DIVLGGHAHQ EYQNIFVGNA 
ILVESGCHLK KMSKIVVDID DETNKYKTAK SELIPLYIEK TGQDEQIKEL AESLRVPGMD 
VVLGNTAAYI SKTPVKEGCK DSPINNWIAD VIAKNVEGDF IVHNVGGARI GLEKGPVTMR 
DIVTLFPFDN KIAVVEVDGK FVKNFFINGI KNGRALYNFH GLTAKFKLKN NKVKNVEIFI 
NGNPLQENKT YKLVTNEYIA KGKTEGWMFK KIEEDKKQFI SLSIRDMLIA DLKANSPLKP 
LNDECRLQVK N