Gene Elen_0656 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0656
Symbol
ID	8414946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	834499
End bp	835530
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	64%
IMG OID	645023631
Product	oxidoreductase molybdopterin binding
Protein accession	YP_003181028
Protein GI	257790422
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.157207
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.0126108
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGATACG CTACTGGGGC AAAGATGCTG GGTTGTACCG TGGTGGGCGC GACCCTTCTG 
CTGGGAGGCG CGGGCGCTCT GGGAGGGCTC GACATGGCGA TGGCCCAAAG CAGCCTGCTT 
CCCGTCGAGA CGATGCAGCG CAACGCGGTG GACTACGACA AGGTTGCGAA CGTCTCGGGC 
GACTTCACCT TCTGCCAGGA CGTGGTTACT CCGGCCGACG AGGTGTTCAA CCTGTTCGGC 
ACGGCGACCA CGGCCCTGTG CGCAAAGCCG GGCTACGCCT TCGACGCGGT CACCCATGAA 
AGCTATTACC TCAACATCGG CGGCAACGTC GAGAAGGTGT ACACGGTGGG TCTCGACGAG 
ATCGAGCGCA TGGACTCCAA GATCCAGAAG ATGCGCTGCA CGTGCGGCAT GAGCCCCGCC 
CTCGCCATGG CCAGCGTCAA GGGCGTCAAG GTGTCCGACA TGCTGTCCAT GACCGACATC 
GCCCCCGAGG TGAACACCAT CACGTTCAAG GACAAGGACG GCTACGGCCT GCCCATGCCC 
CTGTCGTACG TGCTGGAGAA GGAAGCGCTG CTGGTGTACC AGATCGACGA GCAGAAGCTG 
TCCGAGGGCG AGCGCCTGCA GGTGTGGATG CCCGACACCG TGGCCAAGTA CTTCACCCGC 
GCGGTCACCG ACATCGAGCT GTCCGTTTCC GACGAGGTGC CCGAGGTGCA GGGCCCGGAC 
GACGAGTACC GCGCCAAAGT GAACATCCTC AGCACGGTCG ACGGCGGCTT CAAGGTGGGC 
GACATGGTCT CCTTCGAGGG CTACGCCGAC GATTGCGGCG TCAAGGTTGC CTCCGTTGAG 
TTCTCGATGG ACGGAGGGGA GACGTGGACT TCGTTCGACA CCTCCTCCTC GAACGCCGAG 
GACTGGGTGT ACTGGCACTT CGACTACGTG GCCGAGACGG CGGGCACCTT CAAGCTCGAC 
GTCCGCGCGG TCACGGAGGA CGGCACGGTC TCTCCCCTCG CCTCCAGCGT GGTGTTCGAC 
GTTGAAGCGT AG

Protein sequence

MRYATGAKML GCTVVGATLL LGGAGALGGL DMAMAQSSLL PVETMQRNAV DYDKVANVSG 
DFTFCQDVVT PADEVFNLFG TATTALCAKP GYAFDAVTHE SYYLNIGGNV EKVYTVGLDE 
IERMDSKIQK MRCTCGMSPA LAMASVKGVK VSDMLSMTDI APEVNTITFK DKDGYGLPMP 
LSYVLEKEAL LVYQIDEQKL SEGERLQVWM PDTVAKYFTR AVTDIELSVS DEVPEVQGPD 
DEYRAKVNIL STVDGGFKVG DMVSFEGYAD DCGVKVASVE FSMDGGETWT SFDTSSSNAE 
DWVYWHFDYV AETAGTFKLD VRAVTEDGTV SPLASSVVFD VEA