Gene Emin_0996 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0996
Symbol
ID	6262798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1086451
End bp	1088076
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	39%
IMG OID	642611476
Product	phosphoribosylglycinamide synthetase
Protein accession	YP_001875886
Protein GI	187251404
COG category	[I] Lipid transport and metabolism
COG ID	[COG0439] Biotin carboxylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.000037072
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGATAAAG GCAAAGTACT TATAGTTGAC GGATACTCCA CAGGTAAATA TTATGCTGAC 
CGCCTAAAAG AAAGAGGCAT TACTCCTTTT CACCTTACTT CGGGGATGGA AAAAAATACT 
TCACTTCCGC AAGATGTTAT TGAAAAATAC ATTGCCTCGC AAATAGGGAC AAGTTATCAA 
ACAACTTATC TCATGCCTGA TTCACTCCAG TCCTTGTTGG AAGAATTTGG CAAACATAAT 
TTCGCCGCTG TTATACCCGG TACGGAAAGC GGCGTGGAAG TAGCGGAACG TTTGTCCGAA 
TACTTTAAAC TGCCTTCCAA TGATTTTAAG ACAGTTGCCC TTAGAAGGGA TAAGCACCTT 
ATGCAGCAGG CTCTTAAAAA CGCGGGCTTA AAATATATCT CTTTTTTAAA AACAGCCAAG 
GTTGAAGAGG CTCTTTCCTG GATTGAAAAA AATAATTTTA AAAAAATTGT TATAAAACCG 
CTTATGAGCG CGGGAACTGA CGGTGTTAAA GTTTGTGAAG ATAAGGACAG CGTAAAAAAG 
GCTTTTGAGT CTTTGATAGG CACAAAAGAC GGCTTTGGCA GAAAAAATGA CGAGGTTTTG 
GTTGAGCAGT TTATAGAAGG CAAAGAAATT GTTGTTAACT GCGTTTCGCG CGGGGGGGAG 
CATATTTTAA CTGATGTAAT GATTTACAAC AAAATATTAA CCGTTGATAA AAACCCTGTA 
TACGACGCTT CTCTTTTAAT AAAAAACCTT ACTCCGGAAT TTAAAGAATG CGTAGATTAT 
ACTTTTAAAG TTCTTAATGT TTTGGGTATT AAATACGGCG CGTCCCACAC GGAAATAATG 
CTTACACCCG AAGGCCCGGT TCTTATAGAA ACAGGCGCCA GAGTTATGGG AAGGCTTAGC 
GAAATTTATT GGGAAGCCTT GGGCCGCAAC AGCATTGATT TGATTCTTGA CAGCTATCTT 
GACGGCGTAA AGCATAAAGA AAATATGCTT AAGCCTTATA ATCCCAAAAA ATCTTTTCTT 
TATAAATATT TTATTTCTTA TGCGAATGCG GAAATATCTT CCCTTCCTGT TTTTGACAGT 
TTAGGGGAGC TTCCCTGCGT TAGAGAGCTG ACTTTTGCGC TTGCCCGGCA AAGTATGCGC 
GTTAAAAAAA CTATTGATAT GCCTACAATG CCCGGTGAAG GTGTTTTTAT AAGCGAGCAA 
GAGGAAGAGA TTATAAACGC CTATAAAACC GCGCGATTTT TAGAAGTTTG CGCGCCCGGC 
CTTTTGTATG AGCCTAAAGA CGCCGTGCCT ATGGCTTTTG AAAAGGAACT TTTAGCAAAA 
ATTAAGGATA AAGGCTCTTT ATGTGATGAA TATGACACTC TTTTTAAAGG TTTTGAATTA 
AAATATAAAG ATTTTGAAAA CAGTGTTTTA TATGTTTTAA ATGACTTAAT GCTGCCCTGC 
CTTAACGGTG AAATTGGAGA TGTGTATATA GCGGGCAAAC AGCTTTATGA GGATAAACGG 
ACTAAAGAAA CTCTTATCCC TAATCCGTTT TACAGCGTTT TTCTTCCCGT GGCCGCGGAG 
CCCTTTTTAT TTAAAACAGG AGATAAAGGC CGCATCGAAA AAACCGGGGA AATAAAAATT 
TTATAA

Protein sequence

MDKGKVLIVD GYSTGKYYAD RLKERGITPF HLTSGMEKNT SLPQDVIEKY IASQIGTSYQ 
TTYLMPDSLQ SLLEEFGKHN FAAVIPGTES GVEVAERLSE YFKLPSNDFK TVALRRDKHL 
MQQALKNAGL KYISFLKTAK VEEALSWIEK NNFKKIVIKP LMSAGTDGVK VCEDKDSVKK 
AFESLIGTKD GFGRKNDEVL VEQFIEGKEI VVNCVSRGGE HILTDVMIYN KILTVDKNPV 
YDASLLIKNL TPEFKECVDY TFKVLNVLGI KYGASHTEIM LTPEGPVLIE TGARVMGRLS 
EIYWEALGRN SIDLILDSYL DGVKHKENML KPYNPKKSFL YKYFISYANA EISSLPVFDS 
LGELPCVREL TFALARQSMR VKKTIDMPTM PGEGVFISEQ EEEIINAYKT ARFLEVCAPG 
LLYEPKDAVP MAFEKELLAK IKDKGSLCDE YDTLFKGFEL KYKDFENSVL YVLNDLMLPC 
LNGEIGDVYI AGKQLYEDKR TKETLIPNPF YSVFLPVAAE PFLFKTGDKG RIEKTGEIKI 
L