Gene Emin_1077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1077
Symbol
ID	6263495
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1170925
End bp	1173297
Gene Length	2373 bp
Protein Length	790 aa
Translation table	11
GC content	40%
IMG OID	642611557
Product	hypothetical protein
Protein accession	YP_001875966
Protein GI	187251484
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	87
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAAAA TATCCGAAAA CTTAAAAAAC GCTTTAGAAC TTTCTAATCC CAAATATATA 
AAGAAGGCTT TTTTATTCCC CCGTAAGAAG GACCCCGGCG GCGGCTTTAA TCCGGTGCAA 
GATATATCGG AAAAGATTGT TGAAATATCC TCAATTAAAT GGAAATTAGA CAATGAGGAT 
TACGCCGTGT GGAATACTCC GAATACGGTT ATAACGCTTT CAAATAAAAA TAATGAGTTT 
AGGGAAGGAG GTTCTTTTTT TGAGGAAGAT TCTATAATAC ACAAGAGTAA AATTATTATT 
TACGCCGGCG CGGTATGCCG GGGCGGCGCG GAAACGGTTC CTGTTTTTGA AGGATACATA 
TTAAATTCGC CCGTTTATTA CCCTGAGGAA AAAACCGTAA ACTTTACTCT TTCCGGACGT 
CTTGCCGAGT TACAGGAAAT TGATGCCGGC GAAATAAAAT TAACCTCATT AAATGAGGAA 
GCTGTTATTT TAAATGAAAC TTCCGTATGC ACACAATTAA CTTCCGTTTC CAAGATAAAC 
GAAATAAGGC GCGGTTTTTG TTTTAATGAC AGCGCGAATC TTCTTTCCCC ATATGATTAC 
GAGGTTTCTG ATTTAAATAT ATATAAAACG CCGGCTGTAA TTAGTTTAAA AAATCCGCTA 
AAGGAAAACG AAAAAATTTG GCTTTCATAT TCCCATTGGT ATGAAGATAA AGAAATGAAC 
TGGATAATAA AACAAATAGC TGACGCCGCC ATGCTAGATA AAAGAGATAT ACAGGAGGTT 
TCCTTCGGGT CAAATGTTAT TAATAAATTT TCAGAAGGCG CGGGACTTCC TTTTAAAGGC 
AAATACGAAG GTACTGAATA TAACAAGACA AGCGTTACAT TATCATCCGA ATTTCCTTTT 
GATGTTGATT TTGAATGGGA AGTTATGGAA ACCACCTCAA GTGTTTCCTG GAATTTAACG 
GTAAACGGGG TGATGATAAA CGGCTCTTTA AGCGACGCGT GTGTATCGGC AAGAAGCCGG 
CAGGACAAAG CCTGCGGAAC GTGGCAATTT TCCGCATCTC CCGATTGGGA CGGTGAAAGA 
TGTTTTTACC ATTTTATAAG CGATAACGGA TTAAGGCAAA GTTCCAGCGG TTACGCTTTG 
TCTTTTGAAA GGCGTATAAA CGGGTTTTTA ATTTTAAGGA TATACCGGGT AAATAACGGC 
GTTTTAGCCT TGTTGGGAAG TAAGGAACAT TATTACGCTT TTAGGGTAAG CGACGTCTTT 
ATAAGGATTG TAAGGTATGA AGACGGCAGC TTTCGAATAT TTAGCCGCCC TACTAAAACG 
ATAAATGTTT CATTTTGGAC TGATCACGGC ATTTTGTGTT CGGATAATAC TTATAAAGTA 
TCTAATTATC AAATAGCGGT TTTTTATTCA CAGGCGGGAG GCAATAATAT TTCCAATATT 
AAATACGCTT CTTTTACGCC GGACTGGTAT TGTGATTACA GCCCGCAAGG CAGTTATACA 
TCGGGGGAAA TTGATTTGGG CGGCAATTTC CGCTCTTGGG ATAAATTTGA ACTTTCACAA 
ACGGTATCTT CCGGGGTAGA AGCTGCCTGT GAGATACGAT TTAAAGAAAC CGAACACGGA 
GAATGGAGCG GATGGATAGC TATTTCTGAC GGAGAAATTC CTTCCGGCCA GGCCCGTTAC 
GCGCAATTAA GATGGCTGGC AAAGCTAACC GTTAACAACG CCTCTTTAAA ACCTTATTTG 
CATTCCTGGT CGCTCGGATG GAGAAGCAGT AAAGCCAATA TAGGAATGGT AAATACAAGC 
GGTATGAGCG CGCTTGATGT TATGAAAGAA CTTTCCAAAT TAAGCACCTT TGAAATAGGT 
TTTGACCGGG AAAGTAAATT TTTATTCCGC GCAAGAAATG AAGATAAAAA TAATTATATT 
GAAGTAACTT CTAAAGATAT TGTGCGGGTG GAAAATATTA ATTCCGGCGT AGATTACGTT 
TATAACGTTA TAAGCGCTGA TTTTGGCGGC TATAAAGCGA CAGCCTCTCC GCAAACAATG 
GGGGAAGGGT TTCCCGATTC AATTGATATT AACGGAAGGC GTGAGCTTAG TTTAGCTTCA 
GCTTCTTTAC TGCCGCCGGA CAGCGTTGAC ATGGCGGCCA CTATATCAGC AATAGTTTAC 
GATTATTTGA GTAAAAGAAA AAAACGTGCT GTTATTATAA TCAAATTCCT TCCGCAATTG 
GATTTGGGCG ATATCCTTAA AATAACTTAC GCCGAGCCTC TTATAACAAA CAAGCAGGAT 
AAATCATTAA ACGGTGTTTT TATGCGCATA GAAGGGGTTG AGTTTGACCT TGAAAACTGG 
CAAATGCGTA TTGACGCCGT GGAGGTTTTA TGA

Protein sequence

MQKISENLKN ALELSNPKYI KKAFLFPRKK DPGGGFNPVQ DISEKIVEIS SIKWKLDNED 
YAVWNTPNTV ITLSNKNNEF REGGSFFEED SIIHKSKIII YAGAVCRGGA ETVPVFEGYI 
LNSPVYYPEE KTVNFTLSGR LAELQEIDAG EIKLTSLNEE AVILNETSVC TQLTSVSKIN 
EIRRGFCFND SANLLSPYDY EVSDLNIYKT PAVISLKNPL KENEKIWLSY SHWYEDKEMN 
WIIKQIADAA MLDKRDIQEV SFGSNVINKF SEGAGLPFKG KYEGTEYNKT SVTLSSEFPF 
DVDFEWEVME TTSSVSWNLT VNGVMINGSL SDACVSARSR QDKACGTWQF SASPDWDGER 
CFYHFISDNG LRQSSSGYAL SFERRINGFL ILRIYRVNNG VLALLGSKEH YYAFRVSDVF 
IRIVRYEDGS FRIFSRPTKT INVSFWTDHG ILCSDNTYKV SNYQIAVFYS QAGGNNISNI 
KYASFTPDWY CDYSPQGSYT SGEIDLGGNF RSWDKFELSQ TVSSGVEAAC EIRFKETEHG 
EWSGWIAISD GEIPSGQARY AQLRWLAKLT VNNASLKPYL HSWSLGWRSS KANIGMVNTS 
GMSALDVMKE LSKLSTFEIG FDRESKFLFR ARNEDKNNYI EVTSKDIVRV ENINSGVDYV 
YNVISADFGG YKATASPQTM GEGFPDSIDI NGRRELSLAS ASLLPPDSVD MAATISAIVY 
DYLSKRKKRA VIIIKFLPQL DLGDILKITY AEPLITNKQD KSLNGVFMRI EGVEFDLENW 
QMRIDAVEVL