Gene Tgr7_1848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tgr7_1848
Symbol
ID	7315178
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thioalkalivibrio sp. HL-EbGR7
Kingdom	Bacteria
Replicon accession	NC_011901
Strand	-
Start bp	1962835
End bp	1964205
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	68%
IMG OID	643616739
Product	fumarate lyase
Protein accession	YP_002513916
Protein GI	220935017
COG category	[C] Energy production and conversion
COG ID	[COG0114] Fumarase
TIGRFAM ID	[TIGR00979] fumarate hydratase, class II

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGACC AGCAGACCCG AACCGAACGC GACAGCATGG GCACGGTGGA GGTCCCCGCG 
GATGCGCTCT ACGGGGCCCA GACCCAGCGG GCAGTGGACA ACTTCCCGGT CAGTGGTCTG 
CCCATGCCTC CCGGTTTCAT TCATGCCCTG GGGCACATCA AGGGTGCCTG TGCCCGGGCC 
AACGCGGCCC TGGGCGGCCT GGACGCGGAC GTGGCCAAGG CCATCGATGC CGCCGCCCGG 
GAGGTGGCCG AGGGCGGTCA CGACCACCAG TTCCCGGTGG ACGTATTCCA GACCGGTTCC 
GGCACCAGTT CCAACATGAA CGTCAACGAG GTGATCGCCC GGCTGGCCAG CCAGCGCCTG 
GGCAAGCCCG TGCATCCCAA TGACCACGTC AACCGGGGCC AGAGCTCCAA TGACGTGGTG 
CCCACCGCCA TCCACGTCTC TGCCCGCCTG GCCCTGGTCA ATCACCTGCT GCCGTCCCTG 
GATCACCTGG CCCTGACCCT GGAGCGTCGC GCCAGCGAAC TGCGCGACGT GGTCAAGACC 
GGCCGCACCC ACCTGATGGA TGCCATGCCC GTGACCCTGG GCCAGGAACT GGGCGGCTGG 
GCCCGGCAGG TGCGCAACGG CCTGGCGCGC CTGGAGCGCA GCGGCGAGGG CCTGCTGGAG 
CTGGCCCTGG GCGGCACCGC CGTGGGCACC GGCGTCAACG CCGAGCCCGG CTTTGCCAAA 
CTGGTGGCGG AGGAACTGCA GCAGACCACC GGCGAGATCT TCCGCAGCAA GCCGGATTTC 
TTCGAGGGCC TGAGTGCCCA GGACACGGCG GTGGAGATGA GCGGCCAGCT GCGCACCGTC 
GCCGTGAGCC TGATGAAGAT CGCCAACGAC CTGCGCTGGA TGAACTCCGG CCCCCTGGCG 
GGGCTCGGCG AGATCAGCCT GCCGTCCCTG CAGCCCGGCA GCAGCATCAT GCCCGGCAAG 
GTGAATCCGG TGATCCCGGA GTCCGTGGCC ATGGTCTGCG CCCAGGTGAT GGGCAATGAC 
GTGACCGTGA CCGTGGCCGG CCAGTCCGGC AGCTTCCAGT TGAACGTGAT GCTGCCGGTG 
ATCGCGCTGA ACCTCTTGCA GAGCACCGAG CTGCTGGCCA ATGCGGCCCG CCTGCTGGCG 
GACCGGGCCA TCGCCGGCTT CACGGTCAAC GAGGAACGCA TCCGCGAGGC CCTGGACCGC 
AACCCCATCC TGGTCACGGC ACTCAACCCC ATCATCGGCT ACGAGAAGGG CGCGGCCATC 
GCCAAGAAGG CCTATGCCCA GGGCCGGCCG GTGCTGGACG TGGCGCTGGA GGAGACGGAT 
CTTTCGGAAG AGGAACTGCG CCGGCTGCTG GATCCGGGTA AGCTCGTTTA G

Protein sequence

MSDQQTRTER DSMGTVEVPA DALYGAQTQR AVDNFPVSGL PMPPGFIHAL GHIKGACARA 
NAALGGLDAD VAKAIDAAAR EVAEGGHDHQ FPVDVFQTGS GTSSNMNVNE VIARLASQRL 
GKPVHPNDHV NRGQSSNDVV PTAIHVSARL ALVNHLLPSL DHLALTLERR ASELRDVVKT 
GRTHLMDAMP VTLGQELGGW ARQVRNGLAR LERSGEGLLE LALGGTAVGT GVNAEPGFAK 
LVAEELQQTT GEIFRSKPDF FEGLSAQDTA VEMSGQLRTV AVSLMKIAND LRWMNSGPLA 
GLGEISLPSL QPGSSIMPGK VNPVIPESVA MVCAQVMGND VTVTVAGQSG SFQLNVMLPV 
IALNLLQSTE LLANAARLLA DRAIAGFTVN EERIREALDR NPILVTALNP IIGYEKGAAI 
AKKAYAQGRP VLDVALEETD LSEEELRRLL DPGKLV