Gene Emin_0750 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0750
Symbol
ID	6263431
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	825359
End bp	826807
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	42%
IMG OID	642611225
Product	hydrogenase large subunit
Protein accession	YP_001875642
Protein GI	187251160
COG category	[R] General function prediction only
COG ID	[COG4624] Iron only hydrogenase large subunit, C-terminal domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0180769
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.000000000087178
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTAAAT TTGACACTAA AGTACAATTA TTGAAATACA AAGTTTTAAA AGAAGTAGCC 
AAGTACGCTT TTGAGGACAA ACTGCTTGAG AATATGATGA AGATACCGGA AAACATTATT 
CCCGGTAAAA ACGCCACAAT GCGTTGCTGC GTTTATAAAG AAAGGGCCAT AGTGTCCGAA 
CGCGTAAAAA TAGCCATAGG CGGCGACAAA AGGCGCGCCA ACATTGTTGA AGTTATTAAT 
ATAGCGTGTG ATGAATGCCC CGTGGGCGGC TATGAAGTAA CCGCCGCTTG CCGCGGCTGT 
ATAGCACACA GGTGTGAGCA AGTTTGCCCC AAAAATGCCA TAAGTTTTGA CCATGAACAA 
AAAGCGCATA TCGATAAAAC AAAATGCGTG GAATGCGGTT TGTGCGCCAA AGTATGCCCT 
TTCAGTGCAA TACTTTCTTA TAAACGTCCG TGCGAAAAAG CCTGCAAAGT CGTAAATGCC 
ATTTCCATGA ATTCTACGAA AGAAGCTAAA ATTGACGATA AAAAATGCGT TTCCTGCGGC 
GCTTGCATTA ACCAGTGCCC GTTTGGCGCT ATTATGGATA AATCTTTTAT TTTAGACGTT 
ATAGATTTAA TAAAGAAAAG CGAAAATAAC ACAAAATATA AATTGTACGC CGTTGTGGCG 
CCTTCCATAT CAAGCCAGTT CTCTGGTTAT AAACTCGGGC AGGTTATCAC GGGTTTAAAA 
AAGCTGGGTT TTTACCACGT GGTTGAGGCC GCTTTGGGCG CCGATATGGT GGCTATGAAG 
GAATCTTCCG AACTTGAGGA AAAGGGTTTT TTAACAAGCT CCTGCTGTCC CGCTTTTGTA 
AGTTATATTA AAAAGAATTT TCCTGATTTG GAAAAAGATA TATCGCATAA TTTTTCCCCG 
ATGGCGGAAA TTTCAAAGTA CATTAAAGAA ACAACTCCAG GCGCTAAGGT TGTGTTTATC 
GGCCCTTGTA CCGCAAAAAA GATGGAGGCC CATTTAGATA ATGTGCGCCC TTATGTTGAT 
AATGTAATAA CATTTGAAGA ACTTCAGGCT CTTTTTGGGA GCAAGGATAT TGATTTAGGC 
GCTTTGGAAG AAGGCGTTCT TGATAACGCT TCTTACTATG GCAGAATTTT TGCAAGAAGC 
GGCGGACTTT CAGACGCTGT TGCCCAAGCT TTTAAAGAAA AAGGCAGTTC CTTTGCGTGC 
AAGCCTGTTA TCTGCGACGG GCTTGAAGCC TGCAAAATGG CTTTATTAAA AGCAAAAAGC 
AAAATTTTAG ACGGCAACTT TATAGAAGGT ATGGCCTGCC AGGGCGGCTG TATAGGCGGC 
GCGGGCTGCC TTACCCACGG TCCTAAAGAT AAAAACCAGG TTGACGCTTA CGGCAAAGAA 
GCTTTGGAAA AAACTATTAC AGACGCCATT TCCGTATTGG GAACGGACAG CTCAAATACT 
TCAAAATAA

Protein sequence

MIKFDTKVQL LKYKVLKEVA KYAFEDKLLE NMMKIPENII PGKNATMRCC VYKERAIVSE 
RVKIAIGGDK RRANIVEVIN IACDECPVGG YEVTAACRGC IAHRCEQVCP KNAISFDHEQ 
KAHIDKTKCV ECGLCAKVCP FSAILSYKRP CEKACKVVNA ISMNSTKEAK IDDKKCVSCG 
ACINQCPFGA IMDKSFILDV IDLIKKSENN TKYKLYAVVA PSISSQFSGY KLGQVITGLK 
KLGFYHVVEA ALGADMVAMK ESSELEEKGF LTSSCCPAFV SYIKKNFPDL EKDISHNFSP 
MAEISKYIKE TTPGAKVVFI GPCTAKKMEA HLDNVRPYVD NVITFEELQA LFGSKDIDLG 
ALEEGVLDNA SYYGRIFARS GGLSDAVAQA FKEKGSSFAC KPVICDGLEA CKMALLKAKS 
KILDGNFIEG MACQGGCIGG AGCLTHGPKD KNQVDAYGKE ALEKTITDAI SVLGTDSSNT 
SK